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(57) Abstract: The invention relates to a chimeric protein which is derived from a high-threshold calcium channel and which is 
cr^CJ^i^ in thar it consists of at least one p subunit or a fragment of same comprising at least the BID domain, which is fused 
al the NH 2 or COOH end thereof with the I-II loop of an a, subunit or a fragment of same comprising at least the AID domain The 
invention also relates to the applications of said protein in the study of cell signalling pathways that are dependent on G-protein- 
coupled receptors (GPCR) and the identification of compounds that modulate the activity of G proteins. 
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PROTEINE CHIMERIQUE POUR LE CRD3LAGE D'AGONISTES ET 
D'ANTAGONISTES DES VOIES DE SIGNALISATION CELLULAIRE 
DEPENDANTES DES RECEPTEURS COUPLES AUX PROTEINES G 

La presente invention est relative a une protein recombinante 
5 chimerique derivee des sous- unite* a, et p de canaux calciques haut-seuil, ainsi qu'a 
ses applications pour l'etude des voies de signalisation cellulaire dependantes des 
recepteurs couples aux protfines G (RCPG) et 1' identification de composes modulant 
l'activit<£ des proteines G. 

La classe des RCPG comprend plus de mille membres identifies, 
10 codes par des genes representant 245% du potentiel de codage du genome de 
vertebras (El Far et Betz, Biochem. J., 2002, 365, 329-336) ; on denombre 27 genes 
codant pour des sous-unite* Ga, 5 pour les sous-unites G P , et 14 pour les sous-unites 
Gy, (Albert et Robillard, Cell, 2002, 14, 407-418). 

De nombreux processus biologiques comme la regulation 
15 synaptique, la reponse aux hormones et aux pheromones, le guidage cellulaire 
(chemoattraction ou chemorepulsion) ou la vision impliquent les recepteurs couples 
aux proteines G. En effet, les RCPG sont capables d'assurer la reconnaissance et la 
transduction de messages aussi varies que ceux des acides amines (acide 
glutamique...), des peptides (angiotensin, neurotensin, somatostatine. . .), des 
20 proteines (thyrotropin (TSH), hormone folliculo-stimulante (FSH)...), des amines 
(acetylcholine, adrenaline, s6rotonine...), des lipides (prostaglandins, . 
leukotrienes...), des nucleotides et des nucleosides (adenosine ou ATP). Les ions 
(Ca"), les molecules odorantes et gustatives, les photons et les pheromones font 
egalement partie des signaux extracellulaires reconnus par les RCPG (pour revue, voir 
25 Gether, Endocrine reviews, 2000, 21, 90-1 13 et Albert et Robillard, precites). 

Le signal extracellulaire est transduit a I'interieur de la cellule par 
l'intermediaire des proteines G heterotrimeriques liant les nucleotides guanyliques 
(GDP et GTP), composees des sous-unites nommees Ga, GP, Gy ; la reconnaissance 
du signal extracellulaire par le RCPG entrain l'activation des proteines G qui se 
30 traduit par la dissociation de 1'heterotrimere en Ga, et GPy, et la liaison de la sous- 
unite Ga au GTP. 
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Plusieurs effecteurs intracellulaires peuvent etre moduli directe- 
ment ou indirectement par l'activation des differentes sous-unite* Ga et G p Y , des 
proteines-G. Les effecteurs contr61e* par les sous-unite* Ga peuvent etre des enzymes 
(phospholipases A2 et C, adenylyl- et guanylylcyclases, c-jun kinase, tyrosine- 
5 phosphatase (SH-PTP2)...), dont l'activation va influer sur le taux de seconds 
messagers produits ou liberes (phosphoinositides et diacyls-glycerols, Ca", cAMP, 
cGMP...), des canaux (a conductances potassiques, calciques, sodiques ou chlores)' 
des echangeurs ioniques (sodium/proton) ou plus recemment des kinases (tyrosines 
kinases Btk (Bruton's tyrosine kinase), MAP kinases (Mitogen-Activated protein 
1 0 kinase), (Albert et Robillard, precite). 

GPy peut egalement moduler l'activite d'effecteurs au moins aussi 
nombreux que ceux contrdles par Ga, a savoir : les canaux (a conductances sodique, 
calcique dependante du voltage (N et P/Q) ou potassique a rectification entrante 
(GIRK : G protein inward rectifyer K-f channel)...), les enzymes dites « classiques » 
15 (phospholipases A2 et C, adenylyl-cyclase I, H, IV, tyrosine-phosphatase (SH- 
PTP1)...), ainsi qu'un nombre important de kinases (phosphoinositide 3-kinase, 
recepteur P-adrenergique kinases, c-jun kinase, MAP kinases, tyrosine kinases Btk ex 
T-cell-specific kinase (Tsk), (pour revue voir Albert et Robillard, precite). 

Ainsi, l'etude de ces voies de signalisation et la recherche de drogues 
20 agissant sur ces voies de signalisation present un interet topeutique important 
pour la recherche de nouveaux medicaments. 

II ressort de ce qui precede que l'activation des proteines G et lew- 
dissociation en sous-unite* Ga et G P y est le carrefour d'un grand nombre de voies de 
signalisation et de regulation cellulaires. Par consequent, 1'analyse de l'activation de 
25 ces proteines G permet d'etudier les voies de signalisation cellulaire, dependantes des 
recepteurs couples aux proteines G et de cribler des agonistes et des antagonistes de 
ces voies de signalisation. 

Pour analyser l'activation des proteines G, Janetopoulos et al 
(Science, 2001, 291, 2408-2411) ont decrit une technique de suivi, in vivo en temps 
30 r^el, de 1'interaction Ga-Gp. Cette technique, mise au point chez 1'amibe 
Dictyostelium discoideum, est basee sur la cotransfection de deux constructions codant 
pour deux proteines chimeres fluorescentes : Gp-YFP et Ga 2 -CFP. L'interaction entre 
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les deux chimeres.induit un processus de transfert de fluorescence (FRET) qui permet 
un suivi en temps reel de leur interaction dans le cellule vivante. Les deux chimeres 
construites par Janetopoulos et al. sont capables de former un complexe qui interagit 
de maniere fonctionnelle avec le rexepteur a l'AMPc et peut etre active par du GTPyS. 
Cette technique utilisant la fluorescence est adaptable aux approches de criblage a 
haut debit. Toutefois, du fait de la competition avec des sous-unites Ga ou Gp y 
endogenes supprimant le processus de FRET, cette approche ne peut fonctionner que 
dans des cellules debtees gen&iquement de leur proline G equivalente endogene. De 
plus, chez les vertfbres, les diffgrents isoformes de proteines G sont impliquees dans 
la reponse a l'activation des different* recepteurs de type RCPG. En consequence, 
l'approche de Janetopoulos et al. suppose la construction d'une chimere et d'une 
lignee cellulaire speeifiquement del&ee pour chaque isotype de proline G &udie\ 

II ressort de ce qui precede qu'il n'existe pas d'outil ubiquitaire, 
simple a mettre en ceuvre, pour evaluer l'activation des proteines G dans des cellules 
15 eucaryotes. 

Les canaux calciques comprennent des canaux de type bas-seuil, 
s'activant par de faibles depolarisations et des canaux de type haut-seuil, s'activanx 
par de fortes depolarisations. Les canaux de type haut-seuil represent un complexe 
heterommtimerique cWP et y, dans lequel la sous-unite a, membranaire, 

20 constituant le canal proprement dit, est associee a une sous-unite intracellulaire 
regulatrice p (ou Ca v p), par l'intermediaire de son domaine d'interaction (domaine 
ATD pour alpha interaction domain), presentant un motif conserve : QQ-E-L-GY- 
WI— E (code a une lettre ; - represents n'importe quel acide amine" ; Pragnell et al., 
NaEire, 1994, 368, 67-70 ; figure 1) dans lequel les residus Y392, W395 et 1396 sont 

25 essentiels pour la liaison de la sous-unit^ p (De Waard et al., FEBS, 1 996, 380, 272- 
276). La sous-unit* regulatrice p se lie au domaine AID par Fintermediaire de son 
&z?*me BID (beta interaction domain ; DeWaard et al., J. Biol. Chem., 1995, 270, 
12056-12064) qui est inclus dans un domaine GK-like (Hanlon et al., FEBS, 1999, 
445,366-370). 

Sept sous-unites a, ont €t€ identifies : a 1A (Ca v a 2 .,), a 1B (Ca v a 2 . 2 ), 
C^a v a 2 . 3 ), formant respectivement les canaux neuronaux de type P/Q et N et les 
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canaux de type R, regules par les proteines G (canaux sensibles aux prolines G) et 
<x ls (Ca v a,.,), aic(Ca v ai. 2 ), a ld (Ca v a,. 3 ) et a lf (Ca v aj. 4 ), formant les canaux de type L, 
insensibles aux proteines G, incluant les canaux cardiovasculaires (a lc) et 
squelettiques(ctjs), (Lory et al., m/s, 2001, 10, 979-988). 
5 Dans le systeme nerveux central, les canaux calciques haut-seuil de 

type N et P/Q sont directement impliques dans le declenchement du fonctionnement 
de la synapse : leur ouverture sous 1'effet d'un potentiel d'action induit une entree de 
calcium dans la terminaison presynaptique. Ce signal declenche la secretion de 
neuromediateurs tels que le glutamate dans la fente synaptique et, ainsi la propagation 
1 0 de l'influx nerveux dans la dendrite post-synaptique. Les canaux N et P/Q sont regules 
par des recepteurs U6s aux proteines G trimeriques (RCPG) tels que les recepteurs 
metabotropiques de classe III du glutamate (pour revue : El Far et Betz., precite) ou 
les recepteurs noradrenergiques, muscariniques, GABAergiques (GABA 5 y- 
aminobutyric acid), serotoninergiques, dopaminergiques, et aux opiacees (pour revue : 
15 Hille, Trends NeuroSci., 1994, 17, 531-536). II a ete montre que le sous-complexe 
GPy est directement responsable d'une inhibition de 1'activite des canaux P/Q qui 
resulte d'une fixation directe de GPy sur la boucle intra-cytoplasmique reliant les 
domaines membranaires I et II (boucle I-II) de la sous-unite a, (De Waard et al., 
Nature, 1997, 385, 446-450). De fait, cette boucle presente plusieurs sites 
20 d'interaction avec GPy, chevauchants le domaine de liaison a la sous-unite regulatrice 
Ca v p (domaine AID ; Figure 1), dont un motif consensus QQ-R-L-GY inclus dans le 
domaine AID, est essentiel pour la liaison de GPy (Figure 1 ; De Waard et al., Nature 
1997, 385, 446-450 ; Zamponi et al., Nature, 1997, 385, 442-446). De plus, la sous- 
unite regulatrice Ca v p semble contrecarrer l'efifet fonctionnel des prolines G 
25 (Bourinet et al., P.N.A.S., 1996, 93, 1486-1491). Ainsi, il semblerait que cet anta- 
gonisme implique une competition physique entre la sous-unite Ca v p et la proline 
Gp r au niveau de la region AID de la boucle I-II (Dolphin et al., J. Physiol., 1998 
506,3-11). 

Les Inventeurs ont construit des proteines chimeriques par fusion 
30 NH 2 et/ou COOH terminale : 
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(i) de la boucle I-II de la sous-unite" a, de canaux calciques haut-seuil 
sensibles ou insensibles aux proteines G (respectivement, a 1A ou Ca v a 2 , constitutive 
d'un canal neuronal de type P/Q et a lc ou Ca^ constitutive d'un canal de type L 
cardiovasculaire) ou un fragment de celle-ci ; ladite boucle correspond aux positions 

5 367 a 487 en reference a la sequence de la sous-unite Ca v cc 2 ,, et comprend le domaine 
de liaison a une sous-unite p d'un canal calcique (ou domaine AID) et les sites de 
liaison a une sous-unite Gp d'une proline G (figure 1), et 

(ii) d'une sous-unite p d'un canal calcique haut-seuil, capable de se 
lier audit fragment de la sous-unite ai. 

10 Ils ont montr6 <I ue 1'ensemble des proteines chimeriques obtenues - 

comprenant la boucle I-II d'une sous-unite a, issue d'un canal calcique sensible ou 
insensible aux proteines G ou un fragment de celle-ci incluant au moins le domaine 
AID,- possede des proprtetes surprenantes d'interaction intramoleculaire entre les 
domaines de liaison des sous-unites a, et p du canal calcique, qui empSchent la 
15 fixation de la chimere sur le domaine AID d'une sous-unite a,. Ils ont confirme que 
ce masquage du domaine de liaison de la sous-unite p 6tait bien du a son interaction 
intramoleculaire avec le domaine AID, car la delation du domaine AID de la chimere 
retablit cette fixation. Ils ont egalement montre que la fixation de la chimere compre- 
nant la boucle I-n d'une sous-unite ct 1A "sensible aux proteines G», sur le domaine 
20 d'interaction de la sous-unite a, est retablie par addition de Gp Y . Ce resultat a ete 
confirme par la mise en evidence ex vivo, de 1'interaction d'une sous-unite p 
recombinante marquee avec un fluorophore de type Cy3 avec une chimere 
fluorescente de la sous-unite a 1A (GFP-a 1A ), par mesure du transfert de fluorescence 
(FRET) en microscopie confocale. Ces proprietes leur ont permis de demontrer que 
25 de maniere inattendue, la regulation des canaux P/Q passe par un deplacement, par le 
compiexe GPy, de 1'interaction entre la sous-unite tegulatrice p et la sous-unite a du 
canai calcique et non par son inhibition comme cela avait ete suggete precedemment. 

De maniere plus precise, les Inventeurs ont montte que la proteine 
chimerique derivee d'une sous-unite a, sensible aux proteines G existe sous deux 
30 fors*, "fermee" ou "ouverte", respectivement en l'absence ou en presence de sous- 
unite GP capable de se lier audit fragment de la sous-unite a,, soit sous forme de 
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monomere Gp, soit sous forme d'heterodimere GPy. En l'absence de Gp (ou GPy), la 
proteine chimerique est capable de se replier permettant ainsi aux domaines 
d'interaction des sous-unites a, et p du canal calcique de s'associer par une liaison 
intramoleculaire stable (forme fermee). En presence de Gp (ou GPy), la liaison intra- 
5 moleculaire est detruite et les domaines d'interaction des sous-unites a, et p du canal 
calcique se dissocient (forme ouverte), permettant ainsi a chacun des domaines 
d'interagir respectivement avec Gp (domaine d'interaction de la sous-unite a, : 
domaine AID) et/ou une sous-unite a, d'un canal calcique (domaine d'interaction de la 
sous-unite p : domaine BID). 

10 De facon similaire, la proteine chimerique derivee d'une sous-unite 

a, insensible aux proteines G est capable de se replier permettant ainsi aux domaines 
d'interaction des sous-unites a, et p du canal calcique de s'associer par une liaison 
intramoleculaire stable (forme fermee). En consequence, en presence d'antagonistes 
de cette liaison, autres que Gp ou Gp Y , la liaison intramoteculaire peut egalement etre 
15 detruite et les domaines d'interaction des sous-unites a, et p du canal calcique se 
dissocier (forme ouverte), permettant ainsi a chacun des domaines d'interagir 
respectivement avec ledit antagoniste autre que Gp ou GPy (domaine d'interaction de 
la sous-unite a, : domaine AID) et/ou une sous-unite a, d'un canal calcique (domaine 
d'interaction de la sous-unite p : domaine BID). 
20 En consequence, du fait du remaniement de leur structure en presence 

de sous-unites Gp ou GPy libres ou bien d'autres antagonistes de l'interaction entre les 
sous-unites a, et p (passage de la forme fermee a la forme ouverte), les proteines 
chimeriques denvees des sous-unites a, et p de canaux calciques haut-seuil reptesen- 
tent des outils simples a mettre en.oeuvre, sensibles, specifiques et utiles pour les 
25 applications suivantes : 

- les proteines chimeriques derivees d'une sous-unite ai sensible aux 
proteines G (par exemple : a 1A , a 1B et a 1E ) permettent de determiner les variations de 
la concentration cellulaire en sous-unites GPy libres, ex vivo, en temps reel et done de 
mesurer l'activation des proteines G dans les cellules : de telles proteines chimeriques 
30 representee des biocapteurs ubiquitaires de l'activation des proteines G parfaitement 
adaptes a l'etude des voies de signalisation et de regulation cellulaires dependantes des 
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recepteurs couples aux prot6ines G et au criblage d'agonistes/antagonistes de ces voies 
de signalisation capables d'augmenter ou de diminuer la concentration en sous-unites 
GPy libres dans les cellules et done de moduler ractivite" de ces voies de regulation et 
de signalisation cellulaires dependantes des recepteurs coupes aux proteines G. 
5 - les proteines chimeriques derivees d'une sous-unite a, sensible ou 

resistante aux proteines G (par exemple : a 1A , a 1B , a 1E , a lc , a ld , a ls et a lf ) repre- 
sentent des outils simples, sensibles et specifiques, parfaitement adapt6s au criblage 
d'antagonistes de l'interaction entre les sous-unites a, et p, capables de moduler l'acti- 
vite de l'ensemble des canaux calciques haut-seuil. 
10 _ les Proteines chimerique derives d'une sous-unit6 cci et d'une 

sous-unit^ p d'un canal calcique haut-seuil telles que defmies ci-dessus, sont 
egalement utiles pour le controle systematique pharmaco-toxicologique de nouveaux 
medicaments en phase I et la recherche d'agonistes naturels de recepteurs orphelins. 
En effet, le clonage du genome humain a permis d'identifier environs 350 recepteurs 
15 RCPG. Parmi ceux-ci, seulement 200 ont un ligand identify. Les autres, appeles 
recepteurs orphelins, constituent potentiellement des cibles clefs pour 1' identification 
de nouvelles voies de signalisation et de regulation cellulaire. La recherche 
d'agonistes et d'antagonistes de ces recepteurs revet done un interet majeur tant sur le 
plan de la recherche fondamentale que sur le plan therapeutique. 
20 En consequence, la presente invention a pour objet une proline 

chimerique derivee d'un canal calcique haut seuil, caracterisee en ce qu'elle comprend 
au moins une sous-unite" p ou un fragment de celle-ci incluant au moins le domaine 
BID, fusionne(e) a son extremite NH 2 ou COOH avec la boucle I-II d'une sous-unite 
aj ou un fragment de celle-ci incluant au moins le domaine AID. 
25 Conformement a l'invention les domaines AID et BID sont tels que 

definis ci-dessus ; la boucle HI de la sous-unite a, comprend le domaine AID de 
liaison a la sous-unite p et les sites de liaison a la sous-unite Gp d'une proteine G, dont 
un site consensus de liaison qui est inclus dans ce domaine AID. Ces differents 
domaines sont illustres k la figure 1 . 
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L'invention englobe les prolines chimerique issues des sous-unites 
a, et p de vertebres, notamment de mammiferes humains ou non-humains et de leurs 
orthologues chez les invertebtes. 

Des prolines chimeriques conformes a l'invention sont representees 

5 notamment par : 

- une sous-unite p fusionnee a son extremite NH 2 ou COOH avec la 
boucle I-II d'une sous-unite ai, et 

- le domaine GK-like d'une sous-unite p incluant le domaine BID 
(Hanlon et al., precite), fiisionne a son extremite NH 2 ou COOH avec la boucle I-II 

1 0 d'une sous-unite aj 

Conformement a l'invention, la boucle I-II ou son fragment est, soit 
fusionne directement a l'extremite NH 2 ou COOH de la sous-unite p ou de son 
fragment, soit les deux sequences sont separees par un peptide espaceur dont la taille 
et la sequence en acides amines sont tels que les domaines AID et BID de la proteine 
15 chimerique contenant ledit espaceur sont aptes a interagir pour former une liaison 
intramoleculaire qui est deplacee en presence d'antagoniste (passage de la forme 
fermee a la forme ouverte) ; un tel peptide espaceur est notamment reptesente par une 
sequence polyglycine. 

Selon un mode de realisation avantageux de ladite proteine 
20 chimerique, elle est issue d'un canal calcique haut-seuil sensible aux proteines G. 

Selon une disposition avantageuse de ce mode de realisation, ladite 
proteine chimerique comprend un fragment d'une sous-unite a, selectionnee parmi 
otiA, am et aiE. 

Selon un autre mode de realisation avantageux de ladite proteine 
25 chimerique, ladite sous unite p est selectionnee dans le groupe constitue par p,, p 2 , p 3 
etp 4 . 

L'invention englobe Sgalement les proteines chimdriques constitutes 
par des sequences fonctionnellement equivalentes aux sequences telles que d6finies ci- 
dessus, c'est-a-dire dont la sous-unite p et la boucle I-II de la sous-unite a, ou leurs 
30 fragments tels que dermis ci-dessus sont capables de former une liaison 
intramoleculaire par l'intermediaire de leurs domaines d'interaction ; ladite liaison 
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etant eventuellement detruite en presence de sous-unites Gp ou Gpy libres ou bien 
d'autres antagonistes de l'interaction entre les sous-unites ai et p ("forme ouverte"). 
Parmi ces sequences, on peut citer par exemple les sequences derivees des sequences 
precedentes par : 

5 - mutation (substitution et/ou suppression, et/ou addition) d'un ou 

plusieurs acides amines des sequences telles que definies ci-dessus, 

- modification d'au moins une liaison peptidique -CO-NH- de la 
chaine peptidique de la proteine chimerique telle que definie ci-dessus, notammentpar . 
remplacement par une liaison differente de la liaison -CO-NH- (methylene amino, 

10 carba, cetomethylene, thioamide....) ou par introduction d'une liaison de type retro ou 
retro-inverso, et/ou, 

- substitution d'au moins un acide amine de la chaine peptidique de 
la proteme chimerique telle que definie ci-dessus, par un residu d'acide amine non 
proteinogenique. 

1 5 Par residu d'acide amine non proteinogenique, on entend tout acide 

amine n'entrant pas dans la constitution d'une proteine ou d'un peptide naturel, 
notamment tout acide amine dont le carbone portant la chaine lat6rale R, a savoir le 
groupe -CHR-, situe entre -CO- et -NH- dans la chaine peptidique naturelle, est 
remplace par un motif n'entrant pas dans la constitution d'une proteine ou d'un peptide 

20 naturel. 

La pr6sente invention a notamment pour objet une proteine 
chimerique variant issue d'une proteine chim6rique telle que definie ci-dessus, carac- 
terisee en ce qu'elle presente une mutation d'au moins un acide amine dans les 
sequences de la dite sous-unite p et/ou de la boucle I-II d'une sous-unite ai. 

25 Selon un autre mode de realisation avantageux de ladite proteine 

chimerique, ledit variant possede une mutation qui modifie l'affinite de la sous-unite p 
IKS' £fe boucle I-II de la sous-unite a, et/ou reciproquement ; de telles mutations 
permettent d'obtenir une proteine chimerique plus ou moins sensible a la concentration 
en sous-unit6 Gp ou GPy libres. 

30 Parmi ces mutations on peut citer les mutations du domaine AID de 

Doude I-n de la sous-unite a u telles que decrites dans Pragnell et al., precite et De 
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Waard et al. FEES, 1996, 380, 272-276, a savoir : Q383A, Q384A, E386D, E386S 
L389H, G391R, Y392S, Y392F, W395A, I396A et E400A. 

Selon un autre mode de realisation avantageux de ladite proteine 
chimerique ou de son variant, elle est couplee, de preference de maniere covalente a 
5 au moins un marqueur approprie permettant la detection et/ou la purification et/ou 
rimmobilisation de ladite proteine, par exemple : un epitope antigenique, une etiquette 
du type polyhistidine, un compose luminescent (fluorophore telle que la GFP ou Tun 
de ses variants : CFP,YFP et BFP), radioactif, ou en2ymatique. 

Conformement a l'invention le dit couplage est realise par tout 
10 moyen approprie, notamment par une liaison peptidique par Intermedial des 
fonctions COOH et/ou NH 2 terminales de la chaine peptidique, ou bien par une autre 
liaison covalente, telle que par exemple : une liaison ester, ether, thioether, thioester 
par Intermedial de fonctions reactives de la chaine laterale d'un acide amine de la 
chaine peptidique. 

1 5 SeIon mc disposition avantageuse de ce mode de realisation la dite 

proteine chimerique comprend un fluorophore accepteur ou donneur respectivement a 
son extremite NH 2 et/ou COOH. 

Les fluorophores accepteurs, par exemple CFP ou BFP, peuvent 
etre couple indifferemment a 1'extremite NH 2 ou COOH de la proteine chimerique 
20 les fluorophores donneurs, par exemple GFP ou YFP sont fusionne* a 1'extremite 
opposee de ladite proteine chimerique. De telles protSnes chim6riques sont utiles pour 
1'etude ex vivo en temps reel de 1'activation des proteines G et le criblage de molecules 
capables de moduler cette activation par mesure du transfert de fluorescence (FRET). 

En 6ffet ' Ie mar< l ua ge par un compose luminescent presente 
25 1'avantage d'obtenir un signal localise qui ne necessite pas la presence d'autres reactifs 
comme c'est le cas pour les marquages enzymatiques. Ce type de marquage permet 
egalement 1'utilisation de phenomena tel que le transfert d'energie qui pent s'effectuer 
selon deferents mecanismes : transfert d'energie par resonance, transfert d'energie 
radmtaf (1'accepteur absorbe la lumiere 6mise par le donneur) et transfert d'electron. 
J ° Ce transfert d '^gie, entre un compose" "donneur" (D) luminescent 

et un compose "accepteur" (A) luminescent ou non, et qui est dependant de la distance 
entre A et D, a 6x6 utilise pour la realisation de nombreux dosages. On choisit D et A, 
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qui sont couples a chaque extremis de la proline chimerique afin que le transfert 
d'energie n'ait lieu que lorsque l'intercation intramoleculaire entre les domaines BID et 
AID a lieu (forme fermee). Ce phenomene se traduit par une diminution ou extinction 
de la luminescence de D et une emission de luminescence de A si celui-ci est 
5 luminescent, lorsque D est excite\ Lors de ces dosages on mesure soit la variation de la 
luminescence de A, soit la variation de la luminescence de D ; la nature de A et de D 
etant variable. Par exemple, pour mesurer la variation de luminescence de A on peut 
utiliser comme donneur et accepteur deux proteines fluorescentes ou bien comme 
donneur un complexe de terres rares (europium, terbium) avec un chelate, un cryptate 
10 ou un macrocycle et comme accepteur une proteine fluorescente. La mesure de la 
variation de luminescence de D repose sur la capacity d'un compose" (A) a diminuer ou 
supprimer la luminescence d'un autre compose (D) lorsque ceux-ci sont suffisamment 
proches ("Quench"). La gamme de molecules A pouvant etre utilisees est done plus 
etendue et inclut ainsi des composes non luminescents tels que des metaux lourds, des 

1 5 atomes lourds, des molecules chimiques comme par exemple le rouge de methyle, des 
nanoparticules telles que celles vendues sous la denomination Nanogold® par la 
society Nanoprobes (USA), ou bien encore les molecules vendues sous les 
denominations DABCYL® (Eurogentec, Belgique), QSY Dyes (Molecular Probes 
Inc., USA), ElleQuencher® (Oswell/Eurogentec) ou Black Hole Quenchers® 

20 (Biosearch Technologies Inc., USA). 

La presente invention a egalement pour objet un peptide, caracterise 
en ce qu'il comprend un fragment d'au moins 7 acides amines de la sequence de la 
proteine chimerique telle que defrnie ci-dessus, situes a la jonction de la sous-unit6 0 
et de la boucle I-II de la sous-unit^ ai ou de leurs fragments tels que defmis-ci-dessus ; 
25 de tels peptides permettent notamment de produire des anticorps specifiques de la 
proline chimerique selon l'invention. 

La presente invention a egalement pour objet des anticorps, caracte- 
rises en ce qu'ils sont diriges contre une proteine chimerique ou un peptide tels que 
d&finis ci-dessus. 

30 Conformement a l'invention, lesdits anticorps sont soit des anticorps 

monoclonaux, soit des anticorps polyclonaux. 



WO 2004/058977 PCT/FR2003/003860 

12 

Ces anticorps peuvent Stre obtenus par les methodes classiques, 
connues en elles-memes, comprenant notamment l'immunisation d'un animal avec 
une proteine ou un peptide conforme a l'invention, afin de lui faire produire des anti- 
corps dirig^s contre ladite proteine ou ledit peptide. 
5 De tels anticorps sont utiles notamment pour immobiliser la proteme 

chimerique sur un support solide, la purifier ou bien la detecter. 

La presente invention a egalement pour objet une molecule d'acide 
nucleique, caracteris^e en ce qu'elle est selectionnee dans le groupe constitue par les 
sequences codant pour une proteine chimerique ou un peptide tels que defmis ci- 
1 0 dessus et les sequences complementaires des precedentes, sens ou anti-sens. 

L'invention a egalement pour objet des sondes et des amorces, 
caracterisees en ce qu'elles comprennent une sequence d'environ 10 a 30 nucleotides 
correspondant a celle situee a la jonction de la sous-unite p et de la boucle I-II de la 
sous-unite a, ou de leurs fragments tels que defims-ci-dessus ; ces sondes et ces 
15 amorces permettent de d&ecter/amplifier specifiquement lesdites molecules d'acide 
nucleique codant la proteine chimerique selon l'invention. 

L'invention a egalement pour objet d'autres amorces permettant 
d'amplifier specifiquement la sous-unite p et/ou la boucle I-II de la sous-unite a, ou 
leurs fragments tels que definis-ci-dessus, caracterisees en ce qu'elles sont 
20 s&ectionnees dans le groupe constitue par les sequences SEQ ID NO : 1, 2, 4, 6, 7, 8 
et9. 

Les molecules d'acide nucleique selon l'invention sont obtenues par 
des methodes classiques, connues en elles-memes, en suivant les protocoles standards 
tels que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 

25 AUSUBEL, 2000, Wiley and son Inc. Library of Congress, USA). 

Les sequences codant pour une proteine chimerique selon l'invention 
peuvent etre obtenues par amplification d'une sequence nucleique par PCR ou RT- 
PCR a l'aide d'une paire d'amorces appropriee ou bien par criblage de banques d'ADN 
genomique par hybridation avec une sonde homologue. 

30 Les molecules d'acides nucieiques derivees, codant pour un variant 

de la proteine chimerique selon l'invention, sont obtenues par les methodes classiques, 
permettant d'introduire des mutations dans une sequence d'acide nucleique, connues 
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en elles-m6mes, suivant les protocoles standards precites. Par exemple, la sequence 
codant pour un variant de la proteine chimerique selon l'invention peut-etre obtenue 
par mutagenese dirigee selon la mefhode de Kunkel et al., (P.N.A.S., 1985, 82, 488- 
492). 

5 La presente invention a egalement pour objet un vecteur recombinant 

eucaryote ou procaryote, caracterise en ce qu'il comprend un insert constitue par les 
molecules d'acides nucteiques codant pour une proteine chimerique telle que definie 
ci-dessus. 

De preference, ledit vecteur recombinant est un vecteur ^expression 
1 0 dans lequel ladite molecule d'acide nucleique ou l'un de ses fragments sont places sous 
le contr61e d'elements regulateurs de la transcription et de la traduction appropries. En 
outre, ledit vecteur peut comprendre des sequences fusionnees en phase avec 1'extnS- 
mite 5' et/ou 3* dudit insert, utiles pour rimmobilisation, et/ou la detection et/ou la 
purification de la proline exprimee a partir dudit vecteur. De nombreux vecteurs dans 

1 5 lesquels on peut ins6rer une molecule d'acide nucleique d'interSt afm de l'introduire et 
de la maintenir dans une cellule hote eucaryote ou procaryote, sont connus en eux- 
memes ; le choix d'un vecteur approprie depend de l'utilisation envisage pour ce 
vecteur (par exemple replication de la sequence d'interet, expression de cette 
sequence, maintien de la sequence sous forme extrachromosomique ou bien integra- 

20 tion dans le materiel chromosomique de l'hdte), ainsi que de la nature de la cellule 
h6te. Par exemple, on peut utiliser des vecteurs viraux ou non-viraux comme des 
plasmides. 

Ces vecteurs sont construits et introduits dans des cellules hdtes par 
les methodes classiques d'ADN recombinant et de genie g6n6tique, qui sont connues 
25 en elles-m6mes. 

Selon un mode de realisation dudit vecteur recombinant, il s'agit 
d'un vecteur depression eucaryote presentant une sequence selectionn^e dans le 
groupe constitue par les sequences SEQ ID NO: 5 et SEQ ID NO: 10 ; le plasmide 
SEQ ID NO: 5 contient la boucle I-II de la sous-unite Ca v a 2J de lapin fusionn^e a 
30 l'extremit6 C-terminale de sous-unit^ Ca v p 3 de rat, sous le contr61e du promoteur 
CMV et le plasmide SEQ ID NO: 10 contient un insert constitue de 5' en 3' par la 
fusion en phase des fragments suivants : la sequence GAP-43, l'ADNc codant pour 
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l'EGFP (donneur de fluorescence), le domaine GK-like de la sous-unite Ca v p 3 de rat, 
la boucle I-II de la sous-unite Ca v a 2 .i de lapin et l'ADNc codant pour la CFP 
(accepteur de fluorescence). 

La presente invention a egalement pour objet des cellules modifiees 
par une proteine chimerique, une molecule d'acide nucleique ou bien un vecteur 
recombinant tels que d£finis ci-dessus. 

Selon un mode de realisation avantageux de 1'invention, lesdites 
cellules sont des cellules eucaryotes. 

Selon une disposition avantageuse de ce mode de realisation, 
lesdites cellules expriment au moins un recepteur capable de se lier aux proteines G 
(RCPG) ; lesdites cellules sont, soit des cellules exprimant constitutivement au moins 
un RCPG, soit des cellules modifiees qui expriment un RCPG recombinant. 

Des cellules modifiees conformes a 1'invention peuvent etre obte- 
nues par tous moyens, connus en eux-m6mes, permettant d'introduire une molecule 
d'acide nucleique ou une proteine dans une cellule-hote. Par exemple, dans le cas de 
cellules animales, on peut utiliser entre autres des vecteurs viraux tels que les adeno- 
virus, les retrovirus, les lentivirus et les AAV, dans lesquels a ete inseree prealable- 
ment la sequence d'interet ; on peut egalement associer ladite sequence nucleotidique 
(isolee ou inseree dans un vecteur plasmidique) ou peptidique avec une substance lui 
permettant de franchir la membrane des cellules-hdte, par exemple une preparation 
de liposomes, de lipides ou de polymeres cationiques, ou bien l'injecter directement 
dans la cellule hote. 

La presente invention a pour objet des animaux et en particulier des 
mammiferes transgeniques non-humains, caracterises en ce que tout ou partie de leurs 
cellules sont transformees par une molecule d'acide nucleique selon 1'invention. II 
s'agit par exemple d'animaux dans lesquels on a introduit une sequence codant pour la 
proteine chimerique selon 1'invention sous contrdle le controle d'elements regulateurs 
de la transcription et de la traduction appropries. De tels animaux transg6niques sont 
utiles, notamment pour les etapes de criblages secondares : i) pour ^valuer le ciblage 
cellulaire, voire tissulaire d'une mol6cule active sur les RCPG ou les canaux 
calciques, identifiee lors d'un criblage primaire, ii) pour dtudier la biodisponibilit^ 
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d'une telle molecule, et iii) pour la recherche, en premiere approche, d'effets 
secondaires eventuels d'une telle molecule. 

La presente invention a egalement pour objet l'utilisation d'un 
produit s&ectionne" dans le groupe constitue par les prolines chimeriques, les 
5 molecules d'acides nucieiques, les vecteurs recombinants, les cellules modifiees et les 
mammiferes non-humains transgeniques tels que definis ci-dessus, pour l'dtude des 
voies de signalisation et de regulation cellulaires dependantes des recepteurs couples 
aux prolines G. 

La prdsente invention a egalement pour objet l'utilisation d'un 
10 produit s&ectionne dans le groupe constitue par les proteines chimeriques, les 
molecules d'acides nucieiques, les vecteurs recombinants, les cellules modifiees et les 
mammiferes non-humains transgeniques tels que definis ci-dessus, pour le criblage 
d'agonistes et/ou d'antagonistes des voies de signalisation et de regulation cellulaires 
dependantes des recepteurs couples aux prolines G. 
15 La Presente invention a egalement pour objet l'utilisation d'un 

produit selection^ dans le groupe constitue par les proteines chimeriques, les 
molecules d'acides nucieiques, les vecteurs recombinants, les cellules modifiees et les 
mamimferes non-humains transgeniques tels que definis ci-dessus, pour le criblage 
d'antagonistes de Interaction entre les sous-unites on et p des canaux calciques haut- 
20 seuil ; de tels antagonistes sont utiles pour moduler l'activite de l'ensemble des canaux 
calciques haut-seuil et represented done des medicaments susceptibles d'etre utilisees 
dans le traitement des maladies liees a un dysfonctionnement de l'homeostasie 
caicique et des pathologies ou la modulation de l'entree calcique peut compenser un 
J£2at cellulaire, notamment les epilepsies, les ataxies, les migraines, les hypo- et 
25 hyper-calcemies musculaires, le diabete, et les maladies cardiovasculaires. 

Selon un mode de realisation avantageux de l'invention, l'etude des 
vo«s de signalisation et de regulation cellulaires dependantes des recepteurs couples 
aux proteines G est realisee par une methode comprenant au moins les etapes 



suivantes : 

30 



ai) la culture de cellules modifiees exprimant une proteine chimerique 
#un canal calcique sensible aux proteines G et un recepteur couple au proteine 
G, telles que definies ci-dessus, 
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b, ) la transduction d'un signal par l'intermediaire dudit recepteur 
couple aux proteine G, par tout moyen approprie, et 

c, ) la determination, par tout moyen approprie, de la proportion de 
ladite proteine chimerique exprimee dans lesdites cellules qui est liee a une sous-unite 
Gpy. 

Une telle determination permet d'evaluer les variations de la 
concentration cellulaire en sous-unites Gpy libres et done de mesurer l'activation des 
protemes G dans les cellules. 

Selon un mode de realisation avantageux de l'invention, le criblage 
d'agonistes/d'antagonistes des voies de signalisation et de regulation cellulaires 
dependantes des recepteurs couples aux prolines G est realisee par une methode 
comprenant au moins les Stapes suivantes : 

a 2 ) la culture de cellules modifiees exprimant une proteine chimerique 
issue d'un canal calcique sensible aux proteines G et un recepteur couple aux proteines 
15 G, telles que deiinies ci-dessus, 

bj) la transduction d'un signal par l'intermediaire dudit recepteur 
couple aux proteine G, par tout moyen approprie, 

c 2 ) la determination comparative, par tout moyen approprie, de la 
proportion de ladite proteine chimerique exprimee dans les cellules qui est liee a une 
sous-unite GPy, avant et apres la mise en contact desdites cellules en b,) avec une 
molecule a tester, et 

d 2 ) l'identification des molecules agonistes/antagonistes des voies de 
signalisation et de regulation cellulaires dependantes des recepteurs couples aux 
proteines G, corresponds a celles capables respectivement d'augmenter et de dimi- 
25 nuer la concentration cellulaire en sous-unites Gpy libres. 

De maniere avantageuse, lesdites cellules modifiees en a 0 ou en a 2 ) 
expriment une proteine chim6rique telle que deTmie ci-dessus couplee a ses extremites 
NH 2 et COOH, respectivement a un fluorophore donneur et un fluorophore accepteur 
de fluorescence et ladite determination en c,) ou en c 2 ) est efiectuee par la technique 
30 de transfert de fluorescence (FRET). 



20 
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Selon un mode de realisation avantageux de l'invention, le criblage 
d'antagonistes de 1'interaction entre les sous-unites a, et p des canaux calciques haut- 
seuil est realise par une methode comprenant au moins les Stapes suivantes : 

a 3 ) la mise en contact d'une molecule a tester avec une proteine 
5 chimerique issue d'un canal calcique sensible ou insensible aux proteines G telle que 
definie ci-dessus et avec un peptide comprenant le domaine AID d'une sous-unite - a, 
insensible aux proteines G, 

b 3 ) la mesure, par tout moyen approprie, de la liaison de ladite 
proteine chimerique audit peptide, et 

10 °3> 1'identification des antagonistes de Interaction entre les sous- 

unites ci! et p correspondant a ceux avec lesquels on observe une liaison de ladite 
proteine chimerique audit peptide. 

Selon un mode de mise en oeuvre avantageux dudit proc£de, ledit 
peptide comprenant le domaine AID est immobilis6 sur un support solide, et ladite 
15 proteine chimerique est couplee a un marqueur permettant la mesure de ladite liaison 
en b 3 ), tel que deiini ci-dessus, notamment un fluorophore. 

L'invention a egalement pour objet une trousse pour la mise en 
ceuvre des ntethodes telles que deTmis ci-dessus, caracterisee en ce qu'elle inclut au 
moins l'un des produits suivants : une proteine chimerique, un anticorps, un vecteur 
20 recombinant, une cellule modiftee ou un mammifere non-humain transgenique, tels 
que definis ci-dessus. 

La proteine chimerique selon l'invention presente les avantages 

suivants : 

- elle constitue un biocapteur ubiquitaire des sous-unites Gpy libres 
endogenes, adapte a l'etude en temps reel des voies de signalisation et de regulation 
cellulaires d^pendantes des recepteurs couptes au proteine G, et au criblage syste- 
matique (criblage a haut-debit) de molecules capables de les moduler, potentiellement 
utilisables comme medicament pour le traitement des maladies dans lesquelles on 
observe un dysfonctionnement de ces voies, notamment des pathologies du systeme 
30 immunitaire (pour revue voir Lombardi et al, Crit. Rev. Immunology, 2002, 22, 141- 
163 ; Onuffer et Horuk, Trends in Pharmacol, 2002, 23, 459-467) et des pathologies 
neuropsychiatriques et cardiovasculaires (Seifert et Wenzel-Seifert, Naumyn- 



25 
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Schmeideberg's Arch. Pharmacol. , 2002, 366, 381-416). En outre son utilisation est 
simple dans la mesure elle est permet de s'affranchir partiellement des problemes de 
stoechiometrie puisque son utilisation ne fait intervenir que deux molecules 
(Ca v p/Ca v cc-GPy) au lieu de trois partenaires (Ca v oc/Ca v p/Gpy) pour les methodes de 
5 Part anterieur. 

- elle est adaptee au criblage systematique (criblage a haut-dehit) de 
molecules capables de moduler l'activite des canaux calciques a haut-seuil, potentiel- 
lement utilisables comme medicament pour le traitement des maladies dans lesquelles 
on observe un dysfonctionnement de l'homeostasie calcique et des pathologies ou la 

1 0 modulation de l'entree calcique peut compenser un deficit cellulaire telles que defmies 
ci-dessus. 

Outre les dispositions qui precedent, 1' invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre de la proteine chimerique objet de la presente inven- 
15 tion ainsi qu'au dessins annexes, dans lesquels : 

- la figure 1 illustre le chevauchement, dans la boucle I-II de la 
sous-unite Ca v a 2 .i, des domaines de liaison a la sous-unite p (domaine AID) et au 
complexe Gpy. Le domaine AID est represent par une boite noire (positions 383 a 
400). Les sites de liaison pour la sous-unite Gp (Gpy) sont representes par des boites 

20 hachurees ; le site en position centrale (QQ-R-L-GY) qui est essentiel pour la liaison 
de la sous-unite Gp (GPy) est inclus dans le domaine AID. 

- les figures 2 et 3 illustrent le deplacement de l'interaction Ca v a 2 .i- 
Ca v p par le complexe GPy des proteines G : 

- la figure 2a illustre la liaison de la sous-unite p 3 (1 a 3 pM) avec 
25 le domaine AIDi. 2 de la proteine de fusion GST-AID K2 (1 uM), 

- la figure 2b montre que la fusion de la sous-unite p 3 avec la boucle 
I-H de la sous-unite <x 2 ., (Chimere Ca v p 3 - I-II 21 ) empeche sa liaison avec le domaine 
AIDj. 2 de la proteine de fusion GST-AID 12 , 

- la figure 2c montre que la d61etion des 18 acides amine* du 
30 domaine AID 2 ., (Chimere Ca v p 3 - I-II 2 .,AAID) restore la liaison de la sous-unite p 3 

avec le domaine AIDj. 2 de la proteine de fusion GST-AIDi. 2 , 
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- la figure 3 montre que l'addition de complexe GPy deplace 
Interaction intramoleculaire entre la sous-unite Ca v p et la boucle I-n de la sous-unite 
a 2 .i de la chimere Ca v p 3 - Hfe.i, permettant ainsi a la sous-unite p 3 de se lier avec le 
domaine AID, 2 de la proline de fusion GST-AID 12 ; la concentration de GPy, 

5 capable de deplacer 50 % de la liaison entre la sous-unite Ca v p et domaine AID 2 ., 
(IC 50 )estde 160nM, 

- les figures 4 a 7 illustrent 1' analyse en FRET, du desassemblage 
du canal calcique P/Q, induit par le complexe GPy : 

- la figure 4a illustre le marquage au Cy3 de la sous-unite His-Ca v p 3 
10 purifiee. CB : coloration au bleu de Coomassie d'un gel SDS-PAGE illustrant la 

purete de la proteme. FS = enregistrement de la fluorescence d'un gel non colore 
montrant le marquage covalent de la proteine, 

- la figure 4b illustre l'effet de la sous-unite Ca v p 3 couplee a un 

fluorochrome (Cy3-Ca v p 3 ) sur la relation courant-voltage de canaux Ca v cc 2 ., exprimes 

1 5 dans des ovocytes de x&iopes, par comparison avec la sous-unite Ca v p 3 non marquee 
(injection d'ARNc), 

- la figure 5a illustre l'observation en microscopie confocale de deux 
regions distinctes, d'ovocytes de xenopes contenant Ca v a 2 ., et Cy3-Ca v p 3 . T = trans- 
mission, F = fluorescence, 

20 " la fig^e 5b illustre le spectre d' emission de la fluorescence de 

GFP-Ca v a 2 .i, Cy3-Ca v p 3 et (GFP-Ca v a 2 ., + Cy3-Ca v p 3 ), 

- la figure 6 illustre la cinetique de diminution du transfert de 
fluorescence induit par l'injection de 100 nM de GPy. Panneau du haut : variations du 
spectre d'emission de la fluorescence et panneau du bas : variations du rapport des 

25 intensity de fluorescence (R f ) a 585 nm et 525 nm, 

- la figure 7 illustre les valeurs R f des ovocytes non-injectees (-), 
injectees avec Gpy (100 nM) ou avec du GPy inactive par la chaleur (HI- Gpy). 

- la figure 8 (a a c) illustre la sequence du plasmide pcDNA3Cavp3- 

I-n 2 ., (SEQ ID NO: 5) contenant la boucle I-II de la sous-unite" Ca v ot 2 .i de lapin 

30 fiisionnee a l'extremite C-terminale de sous-unite Ca v p 3 de rat, sous le controle du 
promoteur CMV. 
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- la figure 9 (a a c) illustre la sequence du plasmide pCHIC (SEQ ID 
NO: 10) derive du vecteur pEYFPmemb.(CLONTECH), contenant un insert constitue 
de 5' en 3' par la fusion en phase des fragments suivants : la sequence GAP-43, 
l'ADNc codant pour l'EGFP (donneur de fluorescence), le domaine GK-like de la 
5 sous-unite Ca v 0 3 de rat, la boucle HI de la sous-unite Ca v a 2 .i de lapin et l'ADNc 
codant pour la CFP (accepteur de fluorescence). 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
uniquement a titre d'illustration de l'objet de l'invention, dont ils ne constituent en 
aucune maniere une limitation. 
10 EXEMPLE 1; CONSTRUCTION D'UNE PROTEINE CHIMERIQUE 
RECOMBINANTE Cavp3-I-II 2 ., 
1). Materiels et methodes 

L'amplification PCR et le clonage de l'ADN recombinant sont reali- 
ses par les techniques classiques connues de l'Homme du metier, en suivant le 
15 protocoles standards tels que ceux decrits par exemple dans Current Protocols in 
Molecular Biology (Frederick M. AUSUBEL,2000, Wiley and son Inc. Library of 
Congress, USA). 

Un plasmide d'expression contenant un ADNc codant une proteine 
chimerique selon l'invention, constitute par la fusion C-terminale de la sous-unite 03 
20 de rat avec la boucle intracellulaire I-II de la sous-unite ai de lapin et a ete construit 
de la facon suivante: 

L'ADNc de la sous-unite Ca v p 3 de rat (correspondant aux positions 
98 a 1545 de la sequence GENBANK M88755) est amplified par PCR a l'aide des 
amorces sens et anti-sens suivantes: 

25 - 5'-TTTGGTACCATGGATGACGACTCCTACGTGCCCGGGTTTGAGGACTCGGAGGCGGGTT-3' (SEQ ID 
NO: 1), et 

-5'-GCGGAATTCGTAGCTGTCCTTAGGCCMGGCCGGTTACGCTGCCAGTT-3', (SEQ ID NO: 2). 

Le fragment ainsi obtenu a ete clone entre les sites Kpn I et EcoR I 
du plasmide d'expression (pcDNA3, IN VITROGEN) pour donner le plasmide recom- 
30 binantpcDNA3-Ca v p3. 

Le fragment d'ADNc correspondant a la boucle I-II de la sous-unite 
Ca v a 2 .i de lapin (positions 1383 a 1754 de la sequence GENBANK X57477), dont la 
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sequence est illustree par la figure 1, a ete amplifie par PCR a l'aide des amorces sens 
et anti-sens suivantes : 

- 5'-GGGGAATTCGCCAAAGAAAGGGAGCGGGTGGAGAAC-3' (SEQ ID NO: 3 ; De Waard et al., 
precite et Bichet et al., Neuron, 2001, 25, 177-190), et 

5 - 5'-TTTGMTTCTTACTGAGTTTTGACCATGCGACGGATGTAGAAACGCATTCT-3' (SEQ ID NO: 4). 

Le fragment obtenu a ete clone au site EcoR I du plasmide 
pcDNA3-Cav03 pour donner le plasmide recombinant pcDNA3-Ca v p3-I-II 2 1. 

Un plasmide contrdle contenant un ADNc codant une proteine 
chimerique constitu6e par la fusion C-terminale de la sous-unite 03 de rat avec la 
10 boucle intracellulaire HI de la sous-unite Cava 2 ., de lapin deletee du domaine AID a 
et6 construit de facon similaire ; le plasmide recombinant ainsi obtenu est denomme 
pcDNA3-Cavp3-I-II 21 AAID. 
2) Resultats 

Le plasmide recombinant pcDNA3-Ca v p3-I-II 2 ., pr6sente la 
sequence SEQ ID NO: 5. La sequence peptidique deduite de la sequence nucleotique 
obtenue par sequencage automatique de l'insert clone dans le plasmide pcDNA3- 
Ca v p3-I-II 2 ., presente la s6quence attendue pour une proteine chimerique selon 
^invention. De meme la sequence peptidique deduite de la sequence nucleotique 
obtenue par sequencage automatique de l'insert clone dans le plasmide pcDNA3- 
Ca v p3-I-II 2 .,AAID correspond a celle attendue pour une proteine chimerique deletee 
du domaine AID. 

EXEMPLE 2 : MISE EN EVIDENCE IN VITRO DU DEPLACEMENT DE 
L'INTERACTION Ca v a 2 .,-Ca v p PAR LE COMPLEXE Gpy DES PROTEINES 

a. 

25 1) Materiels et methodes 

L'expression de l'ADN recombinant et l'analyse des proteines 
stmv&kizntes sont realises par les techniques classiques connues de lHomme du 
metier, en suivant le protocoles standards tels que ceux decrits par exemple dans 
Current Protocols in Molecular Biology (Frederick M. A USUBEL, 2000, Wiley and 
son Inc, Library of Congress, USA) et dans Current protocols in Immunology (John E 
i-ugim, 2000, Wiley and son Inc, Library of Congress, USA). 
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a) Expression des pr oteines chimeriques recombinantes et de la fusion GST-ATD^ j, 

Les prolines chimeriques Ca v p3-I-II 2 .i et Ca v p3-I-II 2 .iAAID, et la 
sous-unite Ca v p 3 , sont transcrites et traduites in vitro en presence de [ 35 S]-methionine, 
a partir des plasmides tels que decrits a I'exemple 1, a l'aide du kit TNT system 
PROMEGA, en suivant les instructions du fabricant. 

La proteine de fusion GST-AIDi. 2 decrite dans Pragnell et al., precit<§. 
est produite et purifiee comme decrit par les auteurs precedents. La proteine GST 
produite et purifiee dans les memes conditions est utilisee comme controle. 

b) Analyse in viti-o de la regulation de l'interaction Ca y q, ,-Ca .p par le complexe Gfiy 
des proteines G . 

L'analyse in vitro de la regulation de l'interaction Ca v cc 2 .i-Ca v p par le 
complexe GPy des proteines G, est realisee en suivant les protocoles tels que decrits 
dans De Waard et al., Nature, 1997, 385, 446-450. De maniere plus precise, la sous- 
unite p 3 et les proteines chimeriques marquees ([ 35 S] Ca v p3, [ 35 S] Ca v p3-I-II 2 .i et[ 35 S] 
Ca v p3-I-II 2 .iAAID) sont incubees en 1'absence ou en presence de la proteine de fusion 
GST-AID,. 2 ou de la proteine GST, et eventuellement en presence de quantites 
croissantes de GPy (10 a 900 nM, CALBIOCHEM). 

Le produit d'incubation est separe par electrophorese en gel de 
polyacrylamide (SDS-PAGE) et le gel est autoradiographic 
2) Resultats 

Les resultats illustres dans les figures 2 et 3 sont les suivants: 

- la figure 2a montre que la sous-unite p 3 (1 a 3 pM) se lie avec le 
domaine AIDi. 2 de la proteine de fusion GST-AIDj. 2 (lpM), 

- la figure 2b montre que la fusion de la sous-unite p 3 avec laboucle 
I-n de la sous-unite ct 2 ., (Chimere Ca v p 3 - I-H 2 ; ) empeche sa liaison avec le domaine 
AID ] 2 de la proteine de fusion GST-AIDi 2, 

- la figure 2c montre que la deletion des 18 acides amines du 
domaine AID 2 ., (Chimere Ca v p 3 - I-II 2 .,AAID) restore la liaison de la sous-unite p 3 
avec le domaine AIDj. 2 de la proteine de fusion GST- AID,. 2 , 

- la figure 3 montre que l'addition de complexe GPy deplace 
l'interaction intramoleculaire entre la sous-unite Ca v p et la boucle I-II de la sous-unite 
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cxzi de la chimere Ca v p 3 - HI2.1, permettant ainsi a la sous-unite p 3 de se lier avec le 
domaine AID 12 de la proline de fusion GST-AID,. 2 ; la concentration IC 50 de Gpy, 
capable de deplacer 50 % de la liaison entre la sous-unite Ca v p et domaine AID,.,,' 
apres 30 min d'incubation a 30°C, est de 160nM; cette valeur est 2 a 3 fois plus elevee 
5 que celle relatives a l'affinite de Gp Y pour la boucle I-II Xl , precedemment rapportees 
(De Waard et al., Nature , 1997, 385, 446-450). 

EXEMPLE 3 : MISE EN EVIDENCE EX VIVO DU DEPLACEMENT DE 
^INTERACTION Ca v a 2 .,-Ca v p PAR LE COMPLEXE Gpy DES PROTEINES 
G. 

10 1) Materiels et methodes 

a) Marguagg au Cy3 de la protege recombinante His-fXfa r ™*±~ 

La proteine recombinante His-Ca v p 3 purifiee (Geib et al., Biochem 
J., 2002, 364, 285-292 ; Fathallah et al., Eur. J. Neurosci., 2002, 16, 219-228) est 
couplee au maleimide de Cy3 monoreactif en suivant les instructions du fabricant 
1 5 (Amersham Pharmacia Biotech). 

b) Injection des ovocytes de xenope et enr egistrements ^IpctroDhvsioloaiq ,,^ 

La preparation, l'injection des ovocytes de xenopes et les 
enregistrements electrophysiologiques sent realises comme decrit dans Geib et al., 
precite. Les effets des complexes Gpy sur la relation courant-voltage et l'inactivation 
20 de l'etat d'equilibre sont analyses 30 min apres l'injection. 

c) Mesure du tr ansfert de fluorescence (FRET) . 

Les ovocytes sont analyses en microscopie confocale (microscope 
TCS-SP2, LEICA, en mode « XYX »), 4 a 7 jours apres l'injection. 

L'emission de fluorescence est enregistree a l'aide d'un laser a 
argon avec une excitation a 488 nmetun miroir dichroique (488/543/633). La fluores- 
cence est mesuree au travers de 14 filtres (10 nm d'epaisseur) pour reconstruire le 
spectre d'emission. Pour chaque mesure, deux regions differentes sont analysees afin 
d'assurer la reproductibilite de la mesure. Les niveaux de FRET sont estimes par le 
rapport (585/525) entre la fluorescence a 585 nm (pic d'emission de l'accepteur Cy3) 
30 et la fluorescence a 525 nm (pic d'emission du donneur GFP). 
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2) Resultats 

- La sous-unite Ca v p 3 couplee au Cy3 (figure 4a) est aussi active que 
la sous-unite Ca v p 3 sur la regulation des canaux Ca v a 2 .i exprimes dans des ovocytes 
de xenope (Figure 4b). 

5 - L'injection de la proteine Cy3-Ca v p 3 ou GFP-Ca v a 2 .i ou bien de 

l'ADNc codant pour ladite proline, seul(e) ou en combinaison, resulte dans 
remission d'un signal de fluorescence elev6 au niveau de la membrane plasmique 
(Figure 5a). 

L'analyse de 1'emission de fluorescence entre 500 et 640 nm, apres 
1 0 excitation a 488 nm (figure 5b), montre que GFP-Ca v a 2 ., produit un signal eleve avec 
un maximum a 525 nm alors que Cy3-Ca v p3 seul est peu excite et produit un signal 
faible avec un maximum a 585 nm. Lorsque les deux prolines sont dans les ovocytes, 
le signal emis a 525 nm diminue de fa9on drastique alors que celui a 585 nm 
augmente significativement. Ces changements sont facilement quantifiables par la 
1 5 determination du rapport des signaux de fluorescence a 585 nm et 525 nm (R f = 0,34 ± 
0,03 pour GFP-Ca v a 2 .i (n=3), R f = 1,9 ± 0,10 pour Cy3-Ca v p 3 (n=3) et R f = 3,9 ± 0,22 
pour GFP-Ca v ct 2 ., + Cy3-Ca v p 3 (n=7). D'aussi grands changements resultant d'un 
transfert important de fluorescence, demontrent la proximite des fluorochromes GFP- 
Cava 2 .i et Cy3-Cavp3. 

20 " L'injection de GPy dans les ovocytes contenant a la fois GFP- 

Cava 2 .i et Cy3-Cavp 3 induit une disparition rapide du transfert de fluorescence (figure 
6). Par comparison, l'injection de GPy est sans effet dans les cellules contenant 
uniquement GFP- Cava 2 .i ou Cy3-Cavp 3 . 

Le rapport final des signaux de fluorescence (0,82 ± 0,06, n=7) est 

25 de 1'ordre de celui observe dans les ovocytes contenant uniquement GFP- Cava 2 ., ou 
Cy3-Cavp 3 indiquant que la dissociation du canal de Cy3-Cavp 3 est importante 
(figure 7). Par comparaison, l'injection de Gpy inactive par la chaleur est sans effet 
(R f = 3,74 ± 0,4, n=3). 

Ces resultats demontrent que GPy est aussi capable de deplacer ex 
30 vivo la sous-unite Cavp 3 de son site de liaison au canal Cava 2 .j. 



WO 2004/058977 PCT/FR2003/003860 

25- 

EXEMPLE 4 : CONSTRUCTION D'UN BIOCAPTEUR POUR MESURER 
L'ACTIVITE DES PROTEINES G PAR LA TECHNIQUE DE FRET 

Une proteine chimerique contenant un fluorophore donneur de 
fluorescence (EGFP) a son extremite NH 2 et un fluorophore accepteur de fluorescence 
5 (CFP) a son extremite COOH est construite a partir du vecteur pEYFPmemb 
(CLONTECH ). Ce vecteur pr6sente l'avantage de poss6der : 

- une sequence GAP-43 qui permet un ancrage de la chimere a la 
membrane plasmique via son extremis NH 2 . L'ancrage a la membrane presente 
l'int&fit d'une part de maintenir la proteine a la membrane et d'autre part d'augmenter 

10 la probability de rencontre entre la proteine chimere et son ligand GPy qui est lui- 
meme ancre a la membrane par une liaison de type palmitoylation, et 

- une sequence EYFP en aval de GAP-43. 
La construction est realisee en deux etapes : 

- l* re etape de clonage : 

1 5 Le fragment d'ADN codant pour le domaine GK-like de la sous-unite 

0 (Hanlon et al, FEBS, 1999, 445, 366-370) fusionne a la boucle I-II de la sous-unite 
a, est amplifie par PCR a partir du plasmide pcDNA3-Ca v p3-I-II 2 ., (exemple 1) puis il 
est clone en 3' du gene EYFP. 

De maniere plus precise, ramplification PCR est r6alisee a l'aide des 
20 amorces sens et anti-sens suivantes : 
BsiWI Pvul 

- 5'- AGCCGTACGCGATCGCATCTCTAGCCAAGCAGAAGCAAA - 3" (SEQ ID NO: 6) 
Hpal Spel 

5'- CCCGTTAACCCCACTAGTCTGAGTTTTGACCATGCGACGGAT-3' (SEQ ID NO: 7) 

Le produit PCR obtenu est clon6 entre les sites BsiW I et Hpa I du 
plasmide pEYFPmemb pour donner le plasmide pEYFmemChimB&a3I-II. 
- 2' an)e gtape de clonape : 

L' ADNc codant pour l'ECP est amplify par PCR puis clone dans le 
plasmide precedent, en 3' de l'insert P3-I-II. 

De maniere plus precise, l'ECFP est amplifiee par PCR i partir du 
vecteur pECFP (Clontech), a l'aide des amorces sens et anti-sens suivantes : 
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Spel 

- y- GGGACTAGTATGGTGAGCAAGGGCGAGGAGCTG- 3'(SEQ ID NO: 8) 

Hpal 

- 5'- CCCGTTAACTGCCGAGAGTGATCCCGGCGGCGGT-3' (SEQ ID NO: 9) 

Le produit PCR obtenu est clon<S entre les sites Spe I et Hpa I du 
plasmide pEYFmemChimB&a3I-II pour donner le plasmide pCHIC correspondant a 
la sequence SEQ ID NO: 10. 
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REVENDICATTOTVS 

1°) Proteine chimerique derivee d'un canal calcique haut seuil, 
caracterisee en ce qu'elle comprend au moins une sous-unite p ou un fragment de 
celle-ci incluant au moins Ie domaine BID, fusionne(e) a son extremite NH 2 ou COOH 
avec la boucle I-II d'une sous-unite ai ou un fragment de celle-ci incluant au moins le 
domaine AID. 

2°) Proteine chimerique selon la revendication 1, caracterisee en ce 
qu'elle est constitute par une sous-unite p fusionnee a son extremite NH 2 ou COOH 
avec la boucle I-II d'une sous-unite oii. 

3°) Proteine chimerique selon la revendication 1, caracterisee en ce 
qu'elle est constitute par le domaine GK-like d'une sous-unite p fusionne a son extre- 
mite NH 2 ou COOH avec la boucle I-II d'une sous-unite oi. 

4°) Proline selon l'une quelconque des revendications 1 a 3, carac- 
terisee en ce que la sous-unite p ou son fragment et la boucle I-II ou son fragment sont 
separes par un peptide espaceur. 

5°) Proteine chimerique selon l'une quelconque des revendications 1 
a 4, caracterisee en ce qu'elle est issue d'un canal calcique haut-seuil sensible aux 
protemes G. 

6°) Proteine chimerique selon la revendication 5, caracterisee en ce 
qu'elle comprend la boucle MI d'une sous-unite a, selectionnee parmi a 1A , ai B et aj E 
ou un fragment de celle-ci. 

7°) Proteine chimerique selon l'une quelconque des revendications 1 
a caracterisee en ce qu'elle comprend une sous-unite p selectionnee dans le groupe 
constitue par pi, p 2 , p 3 et p 4 ou un fragment de celle-ci. 

8°) Proteine chimerique variant issue d'une proteine chimerique 
sd*s? "une quelconque des revendications 1 a 7, caracterisee en ce qu'elle presente 
une mutation d'au moins un acide amine dans les sequences de la dite sous-unite p 
et/ou de la boucle I-II d'une sous unite cii. 
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9°) Proteine chimerique variant selon la revendication 8, caracterisee 
en ce que ladite mutation modifie l'affinite de la sous-unite 0 pour le fragment de la 
boucle I-II de la sous-unite a et/ou reciproquement. 

10°) Proteine chimerique variant selon la revendication 8 ou la 
revendication 9, caracterisee en ce que lesdites mutations sont selectionnees parmi les 
mutations suivantes du domaine AID de la boucle I-II de la sous-unite a, : Q383A, 
Q384A, E386D, E386S, L389H, G391R, Y392S, Y392F, W395A, I396A et E400A. 

11°) Proteine chimerique selon l'une quelconque des revendications 
1 a 10, caracterisee en ce qu'elle est couplee, de preference de maniere covalente, a au 
moins un marqueur approprie permettant la detection et/ou la purification et/ou 
rimmobilisation de ladite proteine. 

12°) Proteine chimerique selon la revendication 11, caracterisee en 
ce qu'elle comprend un fluorophore accepteur ou donneur respectivement a son 
extremite NH 2 et/ou COOH. 

13°) Proteine chimerique selon la revendication 12, caracterisee en 
ce que le fluorophore accepteur est la proteine fluorescente CFP ou BFP et le fluoro- 
phore donneur est la proteine fluorescente GFP ou YFP. 

14°) Peptide, caracterise en ce qu'il comprend un fragment d'au 
moins 7 acides amines de la sequence de la proteine chimerique selon l'une 
quelconque des revendications 1 a 13 situes a la jonction de la sous-unite p et de la 
boucle I-II de la sous-unite a t d'un canal calcique ou de leurs fragments tels que defi- 
nis a la revendication 1 . 

15°) Anticorps, caracterises en ce qu'ils sont diriges contre une 
proteine selon l'une quelconque des revendications 1 a 13 ou un peptide selon la 
25 revendication 14. 

16°) Molecule d'acide nucleique, caracterisee en ce qu'elle est selec- 
tionnee dans le groupe constitue par les sequences codant pour une proteine 
chimerique selon l'une quelconque des revendications 1 a 13 ou un peptide selon la 
revendication 14, et les sequences complementaires des precedentes, sens ou anti- 
30 sens. 



20 



WO 2004/058977 PCT/FR2003/003860 

29 

17°) Sondes et amorces, caracterisees en ce qu'elles comprennent 
une sequence d'environ 10 a 30 nucleotides correspondant a celle situee a la jonction 
de la sous-unite 0 et de la boucle I-II de la sous-unite ttl d'un canal calcique ou de 
leurs fragments tels que d£finis a la revendication 1 . 

5 1 8°) Amorces aptes a amplifier la sous-unite p et/ou la boucle I-II de 

la sous-unite aj d'un canal calcique ou leurs fragments tels que d6finis a la revendi- 
cation 1, caracterisees en ce qu'elles sont selectionnees dans le groupe constitue par 
les sequences SEQ ID NO: 1, 2, 4, 6, 7, 8 et 9. 

19°) Vecteur recombinant, caracterisd en ce qu'il comprend un insert 
10 selectionne dans le groupe constitue par les molecules d'acides nucleiques selon la 
revendication 16. 

20°) Vecteur recombinant selon la revendication 19, caracterise en 
ce qu'il s'agit d'un vecteur d'expression eucaryote presentant une sequence 
selectionnee dans le groupe constitu6 par les sequences SEQ ID NO: 5 et SEQ ID NO: 
15 10. 

21°) Cellules modifiees par un vecteur recombinant selon la reven- 
dication 19 ou 20, par une molecule d'acide nucleique selon la revendication 16 ou 
par une proteine chimerique selon l'une quelconque des revendications 1 a 13. 

22°) Cellules modifiees selon la revendication 21, caracterisees en 
20 ce qu'il s'agit de cellules eucaryotes. 

23°) Cellules modifiees selon la revendication 21 ou la revendica- 
tion 22, caracterisees en ce qu'elles expriment au moins un recepteur capable de se 
lier aux proteines G. 

24°) Mammifere transgenique non-humain, caracterise en ce que 
25 tout ou partie de ses cellules sont transformees par une molecule d'acide nucleique 
selon la revendication 1 6. 

25°) Utilisation d'un produit selectionne dans le groupe constitue par 
les proteines chimeriques selon l'une quelconque des revendications 1 a 13, les 
molecules d'acides nucleiques selon la revendication 16, les vecteurs recombinants 
30 se.'on la revendication 19 ou la revendication 20, les cellules modifiees selon l'une 
quelconque des revendications 21 a 23 et les mammiferes transgeniques non-humains 
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selon la revendication 24, pour l'etude des voies de signalisation et de regulation 
cellulaires dependantes des recepteurs couples aux prolines G. 

26°) Utilisation d'un produit selectionne dans le groupe constitu6 par 
les proteines chimeriques selon l'une quelconque des revendications 1 a 13, les mole- 
5 cules d'acides nucleiques selon la revendication 1 6, les vecteurs recombinants selon la 
revendication 19 ou la revendication 20, les cellules modifiees selon l'une quelconque 
des revendications 21 a 23 et les mammiferes transgeniques non-humains selon la 
revendication 24 pour le criblage d'agonistes et/ou d'antagonistes des voies de signali- 
sation et de regulation cellulaires dependantes des recepteurs couples aux proteines G. 

10 27 °) Utilisation d'un produit selectionne dans le groupe constitue par 

les proteines chimeriques selon l'une quelconque des revendications 1 a 13, les 
molecules d'acides nucleiques selon la revendication 16, les vecteurs recombinants 
selon la revendication 19 ou la revendication 20, les cellules modifiees selon l'une 
quelconque des revendications 21 a 23 et les mammiferes transgeniques non-humains 

15 selon la revendication 24 pour le criblage d'antagonistes de l'interaction entre les 
sous-unit<§s cci et P des canaux calciques haut-seuil. 

28°) Methode d'etude des voies de signalisation et de regulation 
cellulaires dependantes des recepteurs couples aux proteines G, caracterisee en ce 
qu'elle comprend au moins les etapes suivantes : 

20 a 0 la culture de cellules modifiees exprimant une proline 

chimerique issue d'un canal calcique sensible aux proteines G et un recepteur couple 
au proline G selon la revendication 23, 

bi) la transduction d'un signal par l'intermediaire dudit recepteur 
couple aux proteine G, par tout moyen approprie, et 

25 c 0 la determination, par tout moyen approprie, de la proportion de 

ladite proteine chimerique exprimee dans lesdites cellules qui est liee a une sous-unite 
G0y. 

29°) Methode de criblage d'agonistes/d'antagonistes des voies de 
signalisation et de regulation cellulaires dependantes des recepteurs couples aux 
30 proteines G, caracterisee en ce qu'elle comprend au moins les etapes suivantes : 
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a 2 ) la culture de cellules modifiees exprimant une proteme 
chimerique issue d'un canal calcique sensible aux proteines G et un recepteur couple 
aux proteines G selon la revendication 23, 

b2) la transduction d'un signal par 1' intermediate dudit recepteur 
5 couple aux proteines G, par tout moyen approprie, 

c 2 ) la determination comparative, par tout moyen approprte, de la 
proportion de ladite proteine chim6rique exprimee dans les cellules qui est liee a une 
sous-unite GPy, avant et apres la mise en contact desdites cellules en bj) avec une 
molecule a tester, et 

10 40 l'identification des molecules agonistes/antagonistes des voies de 

signalisation et de regulation cellulaires dependantes des recepteurs couples aux 
proteines G, correspondent a celles capables respectivement d'augmenter et de 
diminuer la concentration cellulaire en sous-unites G0y libres. 

30°) Methode selon la revendication 28 ou la revendication 29, 
15 caracterisee en ce que lesdites cellules modifiees en ai) ou en a 2 ) expriment une 
proteine chimerique couplee, a ses extremity NH 2 et COOH, respectivement a un 
fluorophore donneur et un fluorophore accepteur de fluorescence et ladite determina- 
tion en c0 ou en c 2 ) est effectuee par la technique de transfert de fluorescence (FRET). 

31°) Methode de criblage d'antagonistes de 1'interaction entre les 
sous-unites a, et p des canaux calciques haut-seuil, caracterisee en ce qu'elle 
comprend au moins les etapes suivantes : 

a 3 ) la mise en contact d'une molecule a tester avec une proteine 
chimerique issue d'un canal calcique sensible ou insensible aux prolines G selon Tune 
quelconque des revendications 1 a 13, et avec un peptide comprenant le domaine AID 
25 d'une sous-unit6 aj insensible aux proteines G, 

bj) la mesure, par tout moyen approprte, de la liaison de ladite 
proteine chimerique audit peptide, ef 
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c 3 ) l'identification des antagonistes de l'interaction entre les sous- 
unites aj et p, correspondant a ceux avec lesquels on observe une liaison de ladite 
proteine chimerique audit peptide. 

32°) Methode de criblage selon la revendication 31, caracterisee en 
ce que ledit peptide comprenant le domaine AID est immobilise sur un support solide 
et ladite proteine chimerique est une proteine chimerique selon Tune quelconque des 
revendications 11 a 13. 

33°) Trousse pour la mise en oeuvre d'une methode selon l'une 
quelconque des revendications 28 a 32, caracterisee en ce qu'elle comprend au moins 
un produit selectionne dans le groupe constitue par les proteines chimeriques selon 
l'une quelconque des revendications 1 a 13, les molecules d'acides nucleiques selon la 
revendication 16, les vecteurs recombinants selon la revendication 19 ou la revendica- 
tion 20, les cellules modifiees selon l'une quelconque des revendications 21 a 23 et les 
mammiferes transgeniques non-humains selon la revendication 24. 
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pcDNA3-Ca v 03-I-II2 . 1 (SEQ ID NO: 5) 

1 ATGGATGACG ACTCCTACGT GCCCGGGTTT GAGGACTCCr irr^™, 
,o l , ^ C f CGACTCC ^CACCAGCC GCCCCTCTCT SSSSSi ^gS55£» 
tSS^ CCG GGAGAGTGCC CGGCGAGAAG TGGAGAGTCA gS(SSSg 

151 cagctggaaa gagccaagca caaacctgtg gcatttgctg 

201 TGTCAGCTAC TGTGGAGTTC TGGATGAGGA ATGCCCAGTC SSSSSS^ 
S SS?* 1 ™ CGAGGCCA ^ GATTTTCTGC AcSSaS SSSS 
^^ CTGGT GGATCGGGAG GCTAGTGAAA GAAGGTGGCG SJtSSS 
f m ^™ CAGC CCCCAACG CC TGGAGAGCAT CCGGCTCAAA SSgIISgI 

401 aggccaggag atccgggaac ccttccagcc tgagtgacat tSSJJ™ 

451 CGTTCCCCTC CTCCATCTCT AGCCAAGCAG AAgSSSc IggSSSS 
S^ CCCCG TATGATGTGG TGCCCTCCAT GCgSxSgIS JSSSS 

«m S^ CTCTCT GAAAGGTTAT gaggtcacag acatgatgca SSSctc 

rl^Z TC ° TTAAACACAG CTTTGATGGC AGGATCTCCA JctSJcGcS 

5™ CACGGCTGAC CTCTCACTGG CCAAGCGCTC TGTGCTCAAC AATCCtSS 

701 AGAGGACCAT CATCGAGCGC TCTTCTGCCC GCTCCAGCAT TCWGaSS 

751 CAGAGTGAGA TTGAGCGCAT ATTCGAGCTG GCCAAATCCC Irrlf^t™ 

801 GGTGTTGGAT GCTGACACCA TCAACCACCC SSSSSS 1£Z£££ 

851 CACTGGCCCC CATCATCGTC TTCGTCAAAG TGTCCTCGc£ SSSSS^ 

901 CAGCGACTGA TCCGCTCCAG GGGGAAG^ SSS 

1 no ^ G t TGATG AGCTGGTTCA GTOCcSSS 

1001 ATGTGATTCT GGATGAGAAC CAGCTGGACG ACGCCTGTGA oSSSSS. 

1051 GAATACCTAG AGGTTTACTG GCGCGCTACC cSSSS ^rrr^Z 

1101 CGGGATGCTG GGTCCGCCCA GTGCCATCCC SgSSSS ScSSgC 

1151 TGCTGGGGGA GCGAGGTGAG GAGCATTCAC CCCTGGArrr 

1201 ATGCCCTCGG ATGAGGCCAG TGAGAGCTCC 2££SZ 

™ ?== *™ =E £=1 

EES SEE = =s=s = 

i ^7 ACG ^m^ CAAAGAAAGG GAGCGGGTGG AGAACCGGCG CGCATTCCTG 
1501 AAGCTGCGGC GGCAGCAGCA GATTGAACGC GAGCTCAACG GGTACATPPA 
1551 GTGGATCTCA AAAGCAGAAG AGGTGATCCT CGCAGAGGAr Xra^f^ 

llll ACATCCCTT * ^tggagS? tgSSgSc XSSXS 

1651 AAGAGCAAGA CGGACCTGCT CCACCCAGAG GAGGCGGAGG ATCAGCtS?? 
1701 CGACATCGCC TCCGTGGGGT CTCCCTTTGC CCGAgSgC mSXSSS 
1751 CCAAGCTGGA GAACTCGAGT TTTTTCCAPa a^AAA^rS TAAAAG TG 
1801 TTCTACATCC GTCGCATgS cHUcSS SEESS 2££S2£ 
1851 ATCACACTGG CGGCCGCTCG AGCATGCATC ^tcSSS 
JSJ ^ CCTAA ATGCIAGAGG TCGCTGATCA GCCTCcESg SSSSS 
In^ TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC SgSSSS 

2001 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA aISSSS 
2051 CATTGTCTGA GTAGGTGTCA TTCTATTCTT r^r^r^ AATTGCATCG 
2101 CAGCAAGGGG «=« TTCCG £££££ 

2151 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAgSSSg SS£S 

» SSSS S S£2£ S ™ 

2301 TCSCTTTCTT ccS^SS SSSSSS ££££££ SSSSSJ 

«s ™~ sssss sssss sEs IiE 
as ssssss sss esse EE 
sees sees -sss see EES 
Si ssss sss ssss ssss iEE 
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2751 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTrA 
2801 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC 
2851 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG 
2901 CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 
2951 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT 
3001 ATCCATTTTC GGATC TGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA 
3051 TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG 
3101 CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 
3151 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG 
3201 ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 
3251 TGGC TGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 
3301 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC 
3351 TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT 
3401 GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 
3451 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC 
3501 TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 
3551 GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 
3601 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC 
3651 GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT 
3701 CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 
3751 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC 
3801 AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 
3851 TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT 
3901 TTCGATTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT 
3951 CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT 
4001 TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA 
4051 AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC 
4101 TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTC TGTATAC 
4151 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT 
4201 GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG 
4251 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA 
4301 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG 
4351 CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG 
4401 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 
4451 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA 
4501 GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA 
4551 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC 
4601 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA 
4651 AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG GAAGCTCCCT 
4701 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 
4751 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 
4801 CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC 
4851 CCCCGTTCAG CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT 
4901 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC 
4951 AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG 
5001 GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC 
5051 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 
5101 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT 
5151 TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG 
5201 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG 
5251 AGATTATCAA AAAGGATCTT CACCTAGATC CT TTTAAATT AAAAATGAAG 
5301 TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 
5351 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA 
5401 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG 
5451 CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC 
5501 CGGC TCCAGA TTTATCAGCA ATAAACCAGC GAGCCGGAAG GGCCGAGCGC 
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5551 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG 
5601 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 
5651 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 
5701 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 
5751 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 
5801 GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT 
5851 TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 
5901 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 
5951 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 
6001 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT 
6051 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 
6101 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 
6151 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT 
6201 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTAT T 
6251 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 
6301 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TCGACGGATC 
6351 GGGAGATCTC CCGATCCCCT ATGGTCGACT CTCAGTACAA TCTGCTCTGA 
6401 TGCCGCATAG TTAAGCCAGT ATCTGCTCCC TGCTTGTGTG TTGGAGGTCG 
6451 CTGAGTAGTG CGCGAGCAAA ATTTAAGCTA CAACAAGGCA AGGCTTGACC 
6501 GACAATTGCA TGAAGAATCT GCTTAGGGTT AGGCGTTTTG CGCTGCTTCG 
6551 CGATGTACGG GCGAGATATA CGCGTTGACA TTGATTATTG ACTAGTTATT 
6601 AATAGTAATC AATTACGGGG TCATTAGTTC ATAGCCCATA TATGGAGTTC 
6651 CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC CGCCCAACGA 
6701 CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA 
6751 TAGGGACTTT CCATTGACGT CAATGGGTGG ACTATTTACG GTAAACTGCC 
6801 CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA 
6851 CGTCAATGAC GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT 
6901 TATGGGACTT TCCTACTTGG CAGTACATCT ACGTATTAGT CATCGCTATT 
6951 ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG GATAGCGGTT 
7001 TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT 
7051 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC 
7101 GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT 
7151 AAGCAGAGCT CTC TGGCTAA CTAGAGAACC CACTGCTTAC TGGCTTATCG 
7201 AAATTAATAC GACTCACTAT AGGGAGACCC AAGCTTGGTA CC 
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pCHIC (SEQ ID NO: 10) 

1 ATGCTGTGCT GTATGAGAAG AACCAAACAG GTTGAAAAGA ATCATrArra 
51 CCAAAAGATC ATGGTGAGCA AGGGCGAGGA CCTOtSSK: GGGGtTgtgC 
101 CCATCCTGGT CGAGCTGGAC GGCGACGTAA ACGGCCAclSv (SSSSS; 
151 TCCGGCGAGG GCGAGGGCGA TGCCACCTAC GGCAAGCTGA 
201 CATCTGCACC ACCGGCAAGC TGCCCGTGCC CTGGCCCACC CTCG^cI 
251 CCTTCGGCTA CGGCCTGCAG TGCTTCGCCC GCTACCCCGA cSSSS? 
301 CAGCACGACT TCTTCAAGTC CGCCATGCCC GAAGGCTACG JcSSS 
351 CACCATCTTC TTCAAGGACG ACGGCAACTA CAAGAcSgC c S 
J2? iSUS?* CGACACCCTG GTGAACCGCA TCGAGCTgS GGgStCgS 
4 51 TTCAAGGAGG ACGGCAACAT CCTGGGGCAC AAGCTGGAGT AcScTaSS 
501 CAGCCACAAC GTCTATATCA TGGCCGACAA GCA'GAAGAAC gSJSJSJ 
551 TGAACTTCAA GATCCGCCAC AACATCGAGG ACGGCAGCG^ gSgSJScC 
601 GACCACTACC AGCAGAACAC CCCCATCGGC GACGGCCCCG TGCTGCTGPP 
651 CGACAACCAC TACCTGAGCT ACCAGTCCGC CCTGAgSS ScCCC^CG 
701 AGAAGC GCG A TCACATGGTC CTGCTGGAGT TCGTGACCGC CGCCGGGATC 
751 ACTCTCGGCA TGGACGAGCT GTACGCGATC GCATCTCTAG CcSgcSS 

801 gcaaaagcag gcggaacatg tccccccgta tgatgtggtg ccctcSS? 

on! ^ CTGTGGT GCT GGTGGGA CCCTCTCTGA AAGGTTATGA GGTCaSgAC 
901 ATGATGCAGA AGGCTCTCTT CGACTTCCTT AAACACAGGT TTGATgSXg 
951 GATCTCCATC ACCCGCGTCA CGGCTGACCT CTCACTGGcJ aISgSSg 
1001 TGCTCAACAA TCCTGGCAAG AGGACCATCA TCGAGCGCTC ^TTCTGCCC^C 
1051 TCCAGCATTG CTGAGGTGCA GAGTGAGATT GAGCGCATAT "SgCTGGC 
1101 CAAATCCCTG CAGCTAGTGG TGTTGGATGC TGACACCATC AA^ScAG 
1151 CACAGCTAGC CAAGACCTCA CTGGCCCCCA TCATCGTCT^ XJcaSSg 
1201 TCCTCGCCAA AGGTACTGCA GCGACTGATC CGCTCCAGGG G^AAG^JcCA 
1251 GATGAAGCAC CTCACTGTAC AGATGATGGC ATATGATAAG CTG^SSS 
1301 GCCCACCTGA GTCATTTGAT GTGATTCTGG ATGAGAACCA ScGA^Ar 
1351 GCCTGTGAGC ACCTAGCTGA ATACCTAGAG GT^SJgS gScScSa 
1401 CCACCCAGCA CCGGGCCCCG GGATGCTGGG TCCGCCCAGT SaTCCcS 
tin* GACTTCAGAA CCAGCAGCTG CTGGGGGAGC GAGGTGAGGA GCA^cSc 
is?? SSSSS 6 ACAGTTTGAT GCCCTCGGAT GAGGCCAGTG aSgcScCG 
1551 CCAGGCCTGG ACCGGATCTT CACAGCGCAG CTCCCGCCAT CTrrArrarr 

fSJ JS^ AGA TGCCTACCAG GACCTGTACC AGCCTCACC^ SS 
1651 TCGGGGCTAC CCAGTGCTAA CGGGCATGAC CCCCAAGACC rrrrrS 
1701 CCAGGACTCG GAGCATGACC ACAATGAcJg GAA^SaG cSScSg^ 
1751 CTTGGCCTAA GGACAGCTAC GAATTCGCCA AAGAAAGGGA GCGG^rrAr 
?bS? ^ CGGCGCG CATTC ^GAA GCTGCGGCGG CAGCAGCAGA SSKSKa 
?Q0? ? C J CA ^ CGGG TACATGG ^ GGATCTCAAA AGCAGAAGAG GTGA^cSS 
1901 CAGAGGACGA GACCGACGTG GAGCAGAGAC ATCCCTTTGA TGGAGCTCTG 
1951 CGGAGAGCCA CTATCAAGAA GAGCAAGACG GACCTGCTCC SSagIgS 
2001 GGCGGAGGAT CAGCTGGCCG ACATCGCCTC CGTGGGGTCT TOOTHS 
2051 GAGCCAGCAT TAAAAGTGCC AAGCTGGAGA ACTCGAGTTT S5£Jc2£ 
2 5 JaISSgS CTACATCCGT CGCATGGTCA aUcSS 

tlr., TAGTATGGTG AGCAAGGGCG AGGAGCTGTT CACCGGGGTG GTGCCCATCr 

25 GAGGGCgS Sa^ C GTAAACGGGG ACAGGtJSg CG^SgGC 

iSi = SSSSS SS 

240i S555 AGTCCGCCAT ^™ ^SSS SS 
24M S£SS5£ GCCCGAAGGC TACGTCCAGG AGCGCACCAT 

Hrl, °JJ G ^ C G GACGAC GGCA ACTACAAGAC CCGCGCCGAG GTGAAGTTCG 
£¥; rtrr 0 ^ 0 CCTGGTGA ^ CGCATCGAGC TGAAGGGCAT CGAcJJcUg 
l£\ ^ AG ^ CGGCA ACATCCTGGG GCACAAGCTG GAGTACAACT ATATCAGCCA 
SSSSSS ACAAGCAGAA GAACGGCATC AAGGc2SS 

2701 SSJSSS aSc^ TC gaggacggca gcgtgcagct CGCCGACCAC 

^/Ul TACCAGCAGA ACACCCCCAT CGGCGACGGC CCCGTGCTGC TGCCCGACAA 
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Hol SSSXSS SSSSSSS SS CTGAG CAAAGAGGGG AAGGAGAAGC 

, 9 ": ^rrfrir? T ggtcc tgctg gagttcgtga ccgccgccgg gatcactctc 

o SSSSZSS SSE525 2£2E TAA tggttacaaa ^ 

2951 C*5SS£ SSSEE SSSSS GGcStaAA TT SS 
™S ilSIII 6 " TTAAATTTTT gS£SSS£ SSJSSE 

5 ^ CGAATAGG CCGA ^TCGG CAAAATCCCT TATAAATCAA 
S!J CG «^ TAGGG TTGAGTG TTG TTCCAGTTTG GAAC^GAgS SIS 

3151 AGAACGTGGA ctccaacgtc aaagggcgaa aaaccgtcta SJSJJJJJ 

S!J GGCCCACTAC CTCAACCATC ACCCTAATCA JSSSSS SSg 

3251 ccgtaaagca ctaaatcgga accctaaagg gagcccccga ™SSt 

11V, G ; CGGGGAAA GCCGGGG AAC GTGGCGAGAA AGgSSgS SSSSS23 

3<£ SSSSSSSS SSSSSSS f^ GTGTA GGGG TCACGC TGCGCGTAAC 

^ = 7 ^"-ACACCC GCCGCGCTTA ATGCGCCGCT ACAGGGCGCG TCAfifiTrrr-a 

3451 CTTTTCGGGG AAATGTGCGC GGAACCCCTA TTTGTTtSS SctSS 

«SJ mjj''^^ TGTATCCGCT CATGAGACAA TAACCCTgS aISSSSX 

^o 5 ! 1 ES£3 SES5SS SSSSSSS sssssss is 

S?Si SSSSSS? SSSSSS ^ ttagtSg ™- g — ™ 
5Si SSSSSS SSSSSSSSSS SSSSSS SSSSSSSSS SSSS?? 0 

ISS r C S CGGC CCATTC ^CG CCcSSSSSS SSSSS SSSSSSS 
SSSSSSSSS Sgaggcc^p GGCCTCTGAG ctattccaga 

3 ;ss SSSESS ssssss ssssss 

4 001 GGCCGCTTGG GTGGAGAGGC TATTCGGCTA TGACTrrrra SSS^T 

^i 0 ?! 1 SSSS SEE CCGG? ™™ G ~- 
4 i5i SSS5 SSSSSS SSSSSSS sssssss 

SS 25SS3S SSSSSSS ssssss sssssi i 

J??? A ™ A J CCATC atggctg ^ g caatgcSgSg ssssss SSSSSSSS2 

4 351 CTACCTGCCC ATTCGACCAC CAAGCGAAAC ATCGCATCGA rrrSr^S 

1J°J AC J CGGATGG AAGCCGGTCT TGTCGaSSaS SSSSSSS aSSSSSI 

4 4 51 tcaggggctc gcgccagccg aactgttcgc caggctcaaS SSSSSr? 

5 5 5°J SSSSSSS SEJSE gtgaccca * g ^SSSSSS SSSSSSIS 

4 33 J. ATCATGGTGG AAAATGGCCG CTTTTCTGGA TTCATCGACT CTrrrrrrrr 
22S GGG I GTGGCG GACCGCTA TC AGGACATAGC SSSSSSSS SSSSSS 

i i Ilii ~ ssss ™ 
IS = iflE 1SE llii =1 

4 901 GGGGATCTCA TGCTGGAGTT CTTCGCfPAr rrTnrrr^. CCTCCAGCGC 

sec? iSSSS^ ™ SS SS 

5 SSSgg? JSSSSSf GGTGTTGGGT CGTTTGTTCA 
ouo± «ailL.bercCC AGGGCTGGCA CTCTGTCGAT anrrr^rr^ 

5101 GGGCCAATAC GCCCGCGTTT CTtScSSSSS GAGCCCATTG 

as ass ssss sS iSE I ii 

5251 TTAATTTAAA AGGATCTAGG TGAAGATrrr TTT-v-a™V~ ^ACTTCATTT 
5301 AAATCCCTTA ACGTGAGTTT SSSSSSSSS SSSSSSS CTCATGACCA 

L 3 £ SS??^ 6 gatcttg ^ g ssssss sssssssss ssssssss 

SJSJ C ^ GCA ^ CA M™*™ CGCTACCAGC GGTGGTTtSS SSSSSSSSS 
5451 AAGAGCTACC AACTCTTTTT CCGAAGGTAA CTGGCTTCAG SSSSSS 
5501 ATACCAAATA CTGTCCTTCT AGTGTAGCCG TaSSSISSSS SSSSSS 
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5551 GAACTCTGTA GCACCGCCTA CATACCTCGC TCTGCTAATC CTGTTACCAG 
5601 TGGCTGCTGC CAGTGGCGAT AAGTCGTGTC TTACCGGGTT GGACTCAAGA 
5651 CGATAGTTAC CGGATAAGGC GCAGCGGTCG GGCTGAACGG GGGGTTCGTG 
57 01 CACACAGCCC AGCTTGGAGC GAACGACCTA CACCGAACTG AGATACCTAC 
57 51 AGCGTGAGCT ATGAGAAAGC GCCACGCTTC CCGAAGGGAG AAAGGCGGAC 
5801 AGGTATCCGG TAAGCGGCAG GGTCGGAACA GGAGAGCGCA CGAGGGAGCT 
5851 TCCAGGGGGA AACGCCTGGT ATCTTTATAG TCCTGTCGGG TTTCGCCACC 
5901 TCTGACTTGA GCGTCGATTT TTGTGATGCT CGTCAGGGGG GCGGAGCCTA 
5951 TGGAAAAACG CCAGCAACGC GGCCTTTTTA CGGTTCCTGG CCTTTTGCTG 
6001 GCCTTTTGCT CACATGTTCT TTCCTGCGTT ATCCCCTGAT TCTGTGGATA 
6051 ACCGTATTAC CGCCATGCAT TAGTTATTAA TAGTAATCAA TTACGGGGTC 
6101 ATTAGTTCAT AG C CCA TATA TGGAGTTCCG CGTTACATAA CTTACGGTAA 
6151 ATGGCCCGCC TGGCTGACCG CCCAACGACC CCCGCCCATT GACGTCAATA 
6201 ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC ATTGACGTCA 
6251 ATGGGTGGAG TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 
6301 ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC 
6351 GCCTGGCATT ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA 
64 01 GTACATCTAC GTATTAGTCA TCGCTATTAC CATGGTGATG CGGTTTTGGC 
64 51 AGTACATCAA TGGGCGTGGA TAGCGGTTTG ACTCACGGGG ATTTCCAAGT 
6501 CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC AAAATCAACG 
6551 GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 
6601 GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTGG TTTAGTGAAC 
6651 CGTCAGATCC GCTAGCGCTA CCGGACTCAG ATCTCGAGCT CAAGCTTCGA 
6701 ATTCTGCAGT CGACGGTACC GCGGGCCCGG GATCCACCGG TCGCCACC 
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SEQUENCE LISTING 



<110> Commissariat a 1'Energie Atomique 

institut National de la Sante et de la Recherche Medicale 

DE WAARD f Michel 

DUPUIS, Alain 
GRUNWALD, Didier 
sandoz, Guillaume 



wH 0> . Pro ^ine chimerique pour le criblage d'agonistes et d'antaqonistes des 
p?JtIiSls S G tl0n cellu1airG dependantes des recepteurs couplls aux 



<130> 263PCT87 

<160> 10 

<170> Patentln version 3.1 

<210> 1 

<211> 58 

<212> DNA 



<213> artificial sequence 



<220> 
<223> 



amorce 



<400> 1 

tttggtacca tggatgacga ctcctacgtg cccgggtttg aggactcgga ggcgggtt 

<210> 2 

<211> 48 

<212> DNA 

<213> artificial sequence 



58 



<220> 

<223> amorce 
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<400> 2 

gcggaattcg tagctgtcct taggccaagg ccggttacgc tgccagtt 48 

<210> 3 

<211> 36 

<212> DNA 

<213> artificial sequence 



<220> 

<223> amorce 

<400> 3 

ggggaattcg ccaaagaaag ggagcgggtg gagaac 36 

<210> 4 

<211> 51 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 4 

tttgaattct tactgagttt tgaccatgcg acggatgtag aaacgcattc t 51 

<210> 5 

<211> 7242 

<212> DNA 

^213^ artificial sequence 



<220> 

<223> plasmide recombinant 
<400> 5 

*tgga*gacg actcctacgt gcccgggttt gaggactcgg aggcgggttc agccgactcc 60 

racacca#c- #tccctctct ggactcagac gtttccctgg aggaggaccg ggagagtgcc 120 

cggcgagaag tggagagtca ggctcagcag cagctggaaa gagccaagca caaacctgtg 180 

gcatttgctg tgaggaccaa tgtcagctac tgtggagttc tggatgagga atgcccagtc 240 

^ggctctg gagtcaactt cgaggccaaa gattttctgc acattaaaga gaagtacagc 300 

aangdCtggt ggatcgggag gctagtgaaa gaaggtggcg atattgcctt catccccagc 360 

ccccaacgcc tggagagcat ccggctcaaa caggaacaga aggccaggag atccgggaac 420 
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ccttccagcc tgagtgacat tggcaaccga cgttcccctc ctccatctct agccaagcag 480 

aagcaaaagc aggcggaaca tgtccccccg tatgatgtgg tgccctccat gcggcctgtg 540 

gtgctggtgg gaccctctct gaaaggttat gaggtcacag acatgatgca gaaggctctc 600 

ttcgacttcc ttaaacacag gtttgatggc aggatctcca tcacccgcgt cacggctgac 660 

ctctcactgg ccaagcgctc tgtgctcaac aatcctggca agaggaccat catcgagcgc 720 

tcttctgccc gctccagcat tgctgaggtg cagagtgaga ttgagcgcat attcgagctg 780 

gccaaatccc tgcagctagt ggtgttggat gctgacacca tcaaccaccc agcacagcta 840 

gccaagacct cactggcccc catcatcgtc ttcgtcaaag tgtcctcgcc aaaggtactg 900 

cagcgactga tccgctccag ggggaagtcc cagatgaagc acctcactgt acagatgatg 960 

gcatatgata agctggttca gtgcccacct gagtcatttg atgtgattct ggatgagaac 1020 

cagctggacg acgcctgtga gcacctagct gaatacctag aggtttactg gcgcgctacc 1080 

caccacccag caccgggccc cgggatgctg ggtccgccca gtgccatccc tggacttcag 1140 

aaccagcagc tgctggggga gcgaggtgag gagcattcac ccctggagcg ggacagtttg 1200 

atgccctcgg atgaggccag tgagagctcc cgccaggcct ggaccggatc ttcacagcgc 1260 

agctcccgcc atctggagga ggactatgca gatgcctacc aggacctgta ccagcctcac 1320 

cgtcaacaca cctcggggct acccagtgct aacgggcatg acccccaaga ccggctccta 1380 

gcccaggact cggagcatga ccacaatgac cggaactggc agcgtaaccg gccttggcct 1440 

aaggacagct acgaattcgc caaagaaagg gagcgggtgg agaaccggcg cgcattcctg 1500 

aagctgcggc ggcagcagca gattgaacgc gagctcaacg ggtacatgga gtggatctca 1560 

aaagcagaag aggtgatcct cgcagaggac gagaccgacg tggagcagag acatcccttt 1620 

gatggagctc tgcggagagc cactatcaag aagagcaaga cggacctgct ccacccagag 1680 

gaggcggagg atcagctggc cgacatcgcc tccgtggggt ctccctttgc ccgagccagc 1740 

attaaaagtg ccaagctgga gaactcgagt tttttccaca aaaaagagag gagaatgcgt 1800 

ttctacatcc gtcgcatggt caaaactcag taagaattct gcagatatcc atcacactgg 1860 

cggccgctcg agcatgcatc tagagggccc tatTctatag tgtcacctaa atgctagagc 1920 

tcgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 1980 

cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 2040 

aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 2100 

cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat 2160 

ggcttctgag gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag 2220 

cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag 2280 

cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt 2340 

tccccgtcaa gctctaaatc ggggcatccc tttagggttc cgatttagtg ctttacggca 2400 

cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata 2460 
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gacggttttt 
aactggaaca 
gatttcggcc 
ctgtggaatg 
tatgcaaagc 
agcaggcaga 
aactccgccc 
actaattttt 
gtagtgagga 
atccattttc 
tggattgcac 
acaacagaca 
ggttcttttt 
gcggctatcg 
tgaagcggga 
tcaccttgct 
gcttgatccg 
tactcggatg 
cgcgccagcc 
cgtgacccat 
attcatcgac 
ccgtgatatt 
tatcgccgct 
agcgggactc 
ttcgattcca 
ggctggatga 
tttattgcag 
gcattttttt 
gtctgtatac 
gtgtgaaatt 
aaagcctggg 
gctttccagt 
agaggcggtt 
gtcgttcggc 



cgccctttga 
acactcaacc 
tattggttaa 
tgtgtcagtt 
atgcatctca 
agtatgcaaa 
atcccgcccc 
tttatttatg 
ggcttttttg 
ggatctgatc 
gcaggttctc 
atcggctgct 
gtcaagaccg 
tggctggcca 
agggactggc 
cctgccgaga 
gctacctgcc 
gaagccggtc 
gaactgttcg 
ggcgatgcct 
tgtggccggc 
gctgaagagc 
cccgattcgc 
tggggttcga 
ccgccgcctt 
tcctccagcg 
cttataatgg 
cactgcattc 
cgtcgacctc 
gttatccgct 
gtgcctaatg 
cgggaaacct 
tgcgtattgg 
tgcggcgagc 



cgttggagtc 
ctatctcggt 
aaaatgagct 
agggtgtgga 
attagtcagc 
gcatgcatct 
taactccgcc 
cagaggccga 
gaggcctagg 
aagagacagg 
cggccgcttg 
ctgatgccgc 
acctgtccgg 
cgacgggcgt 
tgctattggg 
aagtatccat 
cattcgacca 
ttgtcgatca 
ccaggctcaa 
gcttgccgaa 
tgggtgtggc 
ttggcggcga 
agcgcatcgc 
aatgaccgac 
ctatgaaagg 
cggggatctc 
ttacaaataa 
tagttgtggt 
tagctagagc 
cacaattcca 
agtgagctaa 
gtcgtgccag 
gcgctcttcc 
ggtatcagct 



S263PCT87.ST25 
cacgttcttt aatagtggac 
ctattctttt gatttataag 
gatttaacaa aaatttaacg 
aagtccccag gctccccagg 
aaccaggtgt ggaaagtccc 
caattagtca gcaaccatag 
cagttccgcc cattctccgc 
ggccgcctct gcctctgagc 
cttttgcaaa aagctcccgg 
atgaggatcg tttcgcatga 
ggtggagagg ctattcggct 
cgtgttccgg ctgtcagcgc 
tgccctgaat gaactgcagg 
tccttgcgca gctgtgctcg 
cgaagtgccg gggcaggatc 
catggctgat gcaatgcggc 
ccaagcgaaa catcgcatcg 
ggatgatctg gacgaagagc 
ggcgcgcatg cccgacggcg 
tatcatggtg gaaaatggcc 
ggaccgctat caggacatag 
atgggctgac cgcttcctcg 
cttctatcgc cttcttgacg 
caagcgacgc ccaacctgcc 
ttgggcttcg gaatcgtttt 
atgctggagt tcttcgccca 
agcaatagca tcacaaattt 
ttgtccaaac tcatcaatgt 
ttggcgtaat catggtcata 
cacaacatac gagccggaag 
ctcacattaa ttgcgttgcg 
ctgcattaat gaatcggcca 
gcttcctcgc tcactgactc 



cactcaaagg cggtaatacg 
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tcttgttcca 
ggattttggg 
cgaattaatt 
caggcagaag 
caggctcccc 
tcccgcccct 
cccatggctg 
tattccagaa 
gagcttgtat 
ttgaacaaga 
atgactgggc 

aggggcgccc 

acgaggcagc 
acgttgtcac 
tcctgtcatc 
ggctgcatac 
agcgagcacg 
atcaggggct 
aggatctcgt 
gcttttctgg 
cgttggctac 
tgctttacgg 
agttcttctg 
atcacgagat 
ccgggacgcc 
ccccaacttg 
cacaaataaa 
atcttatcat 
gctgtttcct 
cataaagtgt 
ctcactgccc 
acgcgcgggg 
gctgcgctcg 
gttatccaca 



2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 
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gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 4560 

cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 4620 

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 4680 

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 4740 

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 4800 

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 4860 

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 4920 

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 4980 

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 5040 

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 5100 

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 5160 

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 5220 

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 5280 

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 5340 

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 5400 

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 5460 

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 5520 

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 5580 

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 5640 

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 5700 

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 5760 

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 5820 

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 5880 

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 5940 

agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 6000 

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 6060 

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 6120 

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 6180 

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 6240 

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 6300 

ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tcgacggatc gggagatctc 6360 

ccgatcccct atggtcgact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 6420 

atctgctccc tgcttgtgtg ttggaggtcg ctgagtagtg cgcgagcaaa atttaagcta 6480 

caacaaggca aggcttgacc gacaattgca tgaagaatct gcttagggtt aggcgttttg 6540 

Page 5 



WO 2004/058977 



PCTYFR2003/003860 



S263PCT87.ST25 

cgctgcttcg cgatgtacgg gccagatata cgcgttgaca ttgattattg actagttatt 6600 

aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat 6660 

aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 6720 

taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 6780 

actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 6840 

cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6900 

tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6960 

tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 7020 

gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 7080 

caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 7140 

aggtctatat aagcagagct ctctggctaa ctagagaacc cactgcttac tggcttatcg 7200 

aaattaatac gactcactat agggagaccc aagcttggta cc 7242 

<210> 6 
<211> 39 
<212> DNA 

<213> artificial sequence 



<220> 

'-22 3-- amorce 
<400> 6 

agccgtacgc gatcgcatct ctagccaagc agaagcaaa 

<210> 7 

<211> 42 

<212> DNA 

<213^ artificial sequence 
<220> 

<223> afflwro 

-«rOO> 7 

cccgttaacc ccactagtct gagttttgac catgcgacgg at 

<210> 8 

<-/12> DKA 
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<220> 

<223> amorce 
<400> 8 

gggactagta tggtgagcaa gggcgaggag ctg 3 

<210> 9 

<211> 34 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 9 

cccgttaact gccgagagtg atcccggcgg cggt 3A 

<210> 10 
<211> 7242 
<212> DNA 

<213> artificial sequence 
<220> 

<223> plasmide recombinant 
<400> 10 

atggatgacg actcctacgt gcccgggttt gaggactcgg aggcgggttc agccgactcc 60 

tacaccagcc gcccctctct ggactcagac gtttccctgg aggaggaccg ggagagtgcc 120 

cggcgagaag tggagagtca ggctcagcag cagctggaaa gagccaagca caaacctgtg 180 

gcatttgctg tgaggaccaa tgtcagctac tgtggagttc tggatgagga atgcccagtc 240 

cagggctctg gagtcaactt cgaggccaaa gattttctgc acattaaaga gaagtacagc 300 

aatgactggt ggatcgggag gctagtgaaa gaaggtggcg atattgcctt catccccagc 360 

ccccaacgcc tggagagcat ccggctcaaa caggaacaga aggccaggag atccgggaac 420 

ccttccagcc tgagtgacat tggcaaccga cgttcccctc ctccatctct agccaagcag 480 

aagcaaaagc aggcggaaca tgtccccccg tatgatgtgg tgccctccat gcggcctgtg 540 

gtgctggtgg gaccctctct gaaaggttat gaggtcacag acatgatgca gaaggctctc 600 

ttcgacttcc ttaaacacag gtttgatggc aggatctcca tcacccgcgt cacggctgac 660 

ctctcactgg ccaagcgctc tgtgctcaac aatcctggca agaggaccat catcgagcgc 720 
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tcttctgccc 
gccaaatccc 
gccaagacct 
cagcgactga 
gcatatgata 
cagctggacg 
caccacccag 
aaccagcagc 
atgccctcgg 
agctcccgcc 
cgtcaacaca 
gcccaggact 
aaggacagct 
aagctgcggc 
aaagcagaag 
gatggagctc 
gaggcggagg 
attaaaagtg 
ttctacatcc 
cggccgctcg 
tcgctgatca 
cgtgccttcc 
aattgcatcg 
cagcaagggg 
g^cttctgag 
cggcgcatta 
cgccctagcg 
t-ccccg^caa 
ccrcgacrrt 
gacggttttt 
aactggaaca 
^ttcggcc 
c*trc|"t'S5aa"t g 
tatgcaaagc 



gctccagcat 
tgcagctagt 
cactggcccc 
tccgctccag 
agctggttca 
acgcctgtga 
caccgggccc 
tgctggggga 
atgaggccag 
atctggagga 
cctcggggct 
cggagcatga 
acgaattcgc 
ggcagcagca 
aggtgatcct 
tgcggagagc 
atcagctggc 
ccaagctgga 
gtcgcatggt 
agcatgcatc 
gcctcgactg 
ttgaccctgg 
cattgtctga 
gaggattggg 
gcggaaagaa 
agcgcggcgg 
cccgctcctt 
gctctaaatc 
SAaaaacttg 
cgccctttga 
acactcaacc 
tattggttaa 
tgtgtcagtt 
atgcatctca 



tgctgaggtg 
ggtgttggat 
catcatcgtc 
ggggaagtcc 
gtgcccacct 
gcacctagct 
cgggatgctg 
gcgaggtgag 
tgagagctcc 
ggactatgca 
acccagtgct 
ccacaatgac 
caaagaaagg 
gattgaacgc 
cgcagaggac 
cactatcaag 
cgacatcgcc 
gaactcgagt 
caaaactcag 
tagagggccc 
tgccttctag 
aaggtgccac 
gtaggtgtca 
aagacaatag 
ccagctgggg 
gtgtggtggt 
tcgctttctt 

ggggcatccc 

attagggtga 
cgttggagtc 
ctatctcggt 
aaaatgagct 
agggtgtgga 
attagtcagc 
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cagagtgaga ttgagcgcat 
gctgacacca tcaaccaccc 
ttcgtcaaag tgtcctcgcc 
cagatgaagc acctcactgt 
gagtcatttg atgtgattct 
gaatacctag aggtttactg 
ggtccgccca gtgccatccc 
gagcattcac ccctggagcg 
cgccaggcct ggaccggatc 
gatgcctacc aggacctgta 
aacgggcatg acccccaaga 
cggaactggc agcgtaaccg 
gagcgggtgg agaaccggcg 
gagctcaacg ggtacatgga 
gagaccgacg tggagcagag 
aagagcaaga cggacctgct 
tccgtggggt ctccctttgc 
tttttccaca aaaaagagag 
taagaattct gcagatatcc 
tattctatag tgtcacctaa 
ttgccagcca tctgttgttt 
tcccactgtc ctttcctaat 
ttctattctg gggggtgggg 
caggcatgct ggggatgcgg 
ctctaggggg tatccccacg 
tacgcgcagc gtgaccgcta 
cccttccttt ctcgccacgt 
tttagggttc cgatttagtg 
tggttcacgt agtgggccat 
cacgttcttt aatagtggac 
ctattctttt gatttataag 
gatttaacaa aaatttaacg 
aagtccccag gctccccagg 
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attcgagctg 
agcacagcta 
aaaggtactg 
acagatgatg 
ggatgagaac 
gcgcgctacc 
tggacttcag 
ggacagtttg 
ttcacagcgc 
ccagcctcac 
ccggctccta 
gccttggcct 
cgcattcctg 
gtggatctca 
acatcccttt 
ccacccagag 
ccgagccagc 
gagaatgcgt 
atcacactgg 
atgctagagc 
gcccctcccc 
aaaatgagga 
tggggcagga 
tgggctctat 
cgccctgtag 
cacttgccag 
tcgccggctt 
ctttacggca 
cgccctgata 
tcttgttcca 
ggattttggg 
cgaattaatt 
caggcagaag 
caggctcccc 
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agcaggcaga 
aactccgccc 
actaattttt 
gtagtgagga 
atccattttc 
tggattgcac 
acaacagaca 
ggttcttttt 
gcggctatcg 
tgaagcggga 
tcaccttgct 
gcttgatccg 
tactcggatg 
cgcgccagcc 
cgtgacccat 
attcatcgac 
ccgtgatatt 
tatcgccgct 
agcgggactc 
ttcgattcca 
ggctggatga 
tttattgcag 
gcattttttt 
gtctgtatac 
gtgtgaaatt 
aaagcctggg 
gctttccagt 
agaggcggtt 
gtcgttcggc 
gaatcagggg 
cgtaaaaagg 
aaaaatcgac 
tttccccctg 
ctgtccgcct 



agtatgcaaa 
atcccgcccc 
tttatttatg 
ggcttttttg 
ggatctgatc 
gcaggttctc 
atcggctgct 
gtcaagaccg 
tggctggcca 
agggactggc 
cctgccgaga 
gctacctgcc 
gaagccggtc 
gaactgttcg 
ggcgatgcct 
tgtggccggc 
gctgaagagc 
cccgattcgc 
tggggttcga 
ccgccgcctt 
tcctccagcg 
cttataatgg 
cactgcattc 
cgtcgacctc 
gttatccgct 
gtgcctaatg 
cgggaaacct 
tgcgtattgg 
tgcggcgagc 
ataacgcagg 
ccgcgttgct 
gctcaagtca 
gaagctccct 
ttctcccttc 



gcatgcatct 
taactccgcc 
cagaggccga 
gaggcctagg 
aagagacagg 
cggccgcttg 
ctgatgccgc 
acctgtccgg 
cgacgggcgt 
tgctattggg 
aagtatccat 
cattcgacca 
ttgtcgatca 
ccaggctcaa 
gcttgccgaa 
tgggtgtggc 
ttggcggcga 
agcgcatcgc 
aatgaccgac 
ctatgaaagg 
cggggatctc 
ttacaaataa 
tagttgtggt 
tagctagagc 
cacaattcca 
agtgagctaa 
gtcgtgccag 
gcgctcttcc 
ggtatcagct 
aaagaacatg 
ggcgtttttc 
gaggtggcga 
cgtgcgctct 
gggaagcgtg 



S263PCT87.ST25 
caattagtca gcaaccatag 
cagttccgcc cattctccgc 
ggccgcctct gcctctgagc 
cttttgcaaa aagctcccgg 
atgaggatcg tttcgcatga 
ggtggagagg ctattcggct 
cgtgttccgg ctgtcagcgc 
tgccctgaat gaactgcagg 
tccttgcgca gctgtgctcg 
cgaagtgccg gggcaggatc 
catggctgat gcaatgcggc 
ccaagcgaaa catcgcatcg 
ggatgatctg gacgaagagc 
ggcgcgcatg cccgacggcg 
tatcatggtg gaaaatggcc 
ggaccgctat caggacatag 
atgggctgac cgcttcctcg 
cttctatcgc cttcttgacg 
caagcgacgc ccaacctgcc 
ttgggcttcg gaatcgtttt 
atgctggagt tcttcgccca 
agcaatagca tcacaaattt 
ttgtccaaac tcatcaatgt 
ttggcgtaat catggtcata 
cacaacatac gagccggaag 
ctcacattaa ttgcgttgcg 
ctgcattaat gaatcggcca 
gcttcctcgc tcactgactc 
cactcaaagg cggtaatacg 
tgagcaaaag gccagcaaaa 
cataggctcc gcccccctga 
aacccgacag gactataaag 
cctgttccga ccctgccgct 
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tcccgcccct 
cccatggctg 
tattccagaa 
gagcttgtat 
ttgaacaaga 
atgactgggc 
aggggcgccc 
acgaggcagc 
acgttgtcac 
tcctgtcatc 
ggctgcatac 
agcgagcacg 
atcaggggct 
aggatctcgt 
gcttttctgg 
cgttggctac 
tgctttacgg 
agttcttctg 
atcacgagat 
ccgggacgcc 
ccccaacttg 
cacaaataaa 
atcttatcat 
gctgtttcct 
cataaagtgt 
ctcactgccc 
acgcgcgggg 
gctgcgctcg 
gttatccaca 
ggccaggaac 
cgagcatcac 
ataccaggcg 
taccggatac 
ctgtaggtat 
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ctcagttcgg 
cccgaccgct 
ttatcgccac 
gctacagagt 
atctgcgctc 
aaacaaacca 
aaaaaaggat 
gaaaactcac 
cttttaaatt 
gacagttacc 
tccatagttg 
ggccccagtg 
ataaaccagc 
atccagtcta 
cgcaacgttg 
tcattcagct 
aaagcggtta 
tcactcatgg 
ttttctgtga 
agttgctctt 
gtgctcatca 
agatccagtt 
accagcgttt 
gcgacacgga 
cagggttatt 
ggggttccgc 
ccgatcccct 
atctgctccc 
caacaaggca 
cgctgcttcg 
aatagtaatc 
aacttacggt 
taatgacgta 
actatttacg 



tgtaggtcgt 
gcgccttatc 
tggcagcagc 
tcttgaagtg 
tgctgaagcc 
ccgctggtag 
ctcaagaaga 
gttaagggat 
aaaaatgaag 
aatgcttaat 
cctgactccc 
ctgcaatgat 
cagccggaag 
ttaattgttg 
ttgccattgc 
ccggttccca 
gctccttcgg 
ttatggcagc 
ctggtgagta 
gcccggcgtc 
ttggaaaacg 
cgatgtaacc 
ctgggtgagc 
aatgttgaat 
gtctcatgag 
gcacatttcc 
atggtcgact 
tgcttgtgtg 
aggcttgacc 
cgatgtacgg 
aattacgggg 
aaatggcccg 
tgttcccata 
gtaaactgcc 



tcgctccaag 
cggtaactat 
cactggtaac 
gtggcctaac 
agttaccttc 
cggtggtttt 
tcctttgatc 
tttggtcatg 
ttttaaatca 
cagtgaggca 
cgtcgtgtag 
accgcgagac 
ggccgagcgc 
ccgggaagct 
tacaggcatc 
acgatcaagg 
tcctccgatc 
actgcataat 
ctcaaccaag 
aatacgggat 
ttcttcgggg 
cactcgtgca 
aaaaacagga 
actcatactc 
cggatacata 
ccgaaaagtg 
ctcagtacaa 
ttggaggtcg 
gacaattgca 
gccagatata 
tcattagttc 
cctggctgac 
gtaacgccaa 
cacttggcag 



S263PCT87.ST25 
ctgggctgtg tgcacgaacc 
cgtcttgagt ccaacccggt 
aggattagca gagcgaggta 
tacggctaca ctagaaggac 
ggaaaaagag ttggtagctc 
tttgtttgca agcagcagat 
ttttctacgg ggtctgacgc 
agattatcaa aaaggatctt 
atctaaagta tatatgagta 
cctatctcag cgatctgtct 
ataactacga tacgggaggg 
ccacgctcac cggctccaga 
agaagtggtc ctgcaacttt 
agagtaagta gttcgccagt 
gtggtgtcac gctcgtcgtt 
cgagttacat gatcccccat 
gttgtcagaa gtaagttggc 
tctcttactg tcatgccatc 
tcattctgag aatagtgtat 
aataccgcgc cacatagcag 
cgaaaactct caaggatctt 
cccaactgat cttcagcatc 
aggcaaaatg ccgcaaaaaa 
ttcctttttc aatattattg 
tttgaatgta tttagaaaaa 
ccacctgacg tcgacggatc 
tctgctctga tgccgcatag 
ctgagtagtg cgcgagcaaa 
tgaagaatct gcttagggtt 
cgcgttgaca ttgattattg 
atagcccata tatggagttc 
cgcccaacga cccccgccca 
tagggacttt ccattgacgt 
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ccccgttcag 
aagacacgac 
tgtaggcggt 
agtatttggt 
ttgatccggc 
tacgcgcaga 
tcagtggaac 
cacctagatc 
aacttggtct 
atttcgttca 
cttaccatct 
tttatcagca 
atccgcctcc 
taatagtttg 
tggtatggct 
gttgtgcaaa 
cgcagtgtta 
cgtaagatgc 
gcggcgaccg 
aactttaaaa 
accgctgttg 
ttttactttc 
gggaataagg 
aagcatttat 
taaacaaata 
gggagatctc 
ttaagccagt 
atttaagcta 
aggcgttttg 
actagttatt 
cgcgttacat 
ttgacgtcaa 
caatgggtgg 
ccaagtacgc 
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S263PCT87.ST25 

cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6900 

tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6960 

tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 7020 

gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 7080 

caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 7140 

aggtctatat aagcagagct ctctggctaa ctagagaacc cactgcttac tggcttatcg 7200 

aaattaatac gactcactat agggagaccc aagcttggta cc 7242 
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pcDNA3-Ca v p3-I-II2 . 1 (SEQ ID NO: 5) 

* A J^ T 7 GACG ACTCCTACGT GCCCGGGTTT GAGGACTCGG AGGCGGGTTC 
, 01 A( 1 CCGACTCC TACACCAGCC GCCCCTCTCT GGACTCAGAC g7ttSt GG 
™ GGACCG GGAGA GTGCC CGGCGAGAAG TGGAGAGTCA GG^TcSS 
151 CAGCTGGAAA GAGCCAAGCA CAAACCTGTG GCATTTGCTG TcSS^Sf 
201 TGTCAGCTAC TGTGGAGTTC TGGATGAGGA ATGCcSgTC cSStSg' 
251 GAGTCAACTT CGAGGCCAAA GATTTTCTGC ACATTAAAGA GA^SSS 
^ ^GACTGGT GGATCGGGAG GCTAGTGAAA GAAGGTGGCG A^^JSS 
351 CATCCCCAGC CCCCAACGCC TGGAGAGCAT CCGGCTCAAA CaSSaSgI 
IE ^^ CAGGAG ATCCGGGAAC CCTTCCAGCC TGAGTGACaJ SSaISga" 

451 CGTTCCCCTC ctccatctct agccaagcag aagcaaaagc IggSSS™ 

501 TGTCCCCCCG TATGATGTGG TGCCCTCCAT GCGGCC^S ctSgG^S 
551 GACCCTCTCT GAAAGGTTAT GAGGTCACAG ACATGAtSS GAaSgScTC 
601 TTCGACTTCC TTAAAGACAG GTTTGATGGC AGGATCTcS ^CCGcS 
651 CACGGCTGAC CTCTCACTGG CCAAGCGCTC TGTGCTCAAC aScSSS 
701 AGAGGACCAT CATCGAGCGC TCTTCTGCCC GCTCCAGCAT TCcSSSS 
Inl ^ GTGAGA TTGAGCGCAT ATTCGAGCTG GCCAAAtSc £SSt2S 
1°* GG ^ G ^ GGAT GCTGACACCA TCAACCACCC AGCACAGCTA 
851 CACTGGCCCC CATCATCGTC TTCGTCAAAG TGTCCTCGCC AAAGGTACTn 
901 CAGCGACTGA TCCGCTCCAG GGGGAAGTCC CAGATGAaS SStSStS 
951 ACAGATGATG GCATATGATA AGCTGGTTCA GTGCCCACcJ gSSS^ 
1001 ATGTGATTCT GGATGAGAAC CAGCTGGACG ACGCCTGTGA ^SCACCTAGCT 
JXJ ^ ATACCTAG AGGTTTACTG GCGCGCTACC CACCACCcS CASSIS 
1101 CGGGATGCTG GGTCCGCCCA GTGCCATCCC TGGACTTCAG ScSgSgC 
1151 TGCTGGGGGA GCGAGGTGAG GAGCATTCAC CCCTGGAGCG SSSgStg 
1201 ATGCCCTCGG ATGAGGCCAG TGAGAGCTCC CGCCAGGcS SSgStc 
1251 TTCACAGCGC AGCTCCCGCC ATCTGGAGGA GGACTATgS gSgSSS 
llll ^nZtT CCAGCCTCAC CGTCAACACA CCTCGGgSS £S££g 
1351 aacgggcatg acccccaaga ccggctccta GCCCAGGACT ^r^r^* 
1401 CCACAATGAC CGGAAC TGGC AGCGTAACCG SSSc? AaSSgS 

liol AaSJSg? SSa^JS GAGCGGGTGG AGAACCGGCG ctcSScTG 
™° GGCAGCAGCA GATTGAACGC GAGCTCAACG GGTACATGGA 

1551 GTGGATCTCA AAAGCAGAAG AGGTGATCCT CGCAGAGGAC GAGA^SSS 
itH ? GGAGCAGAG ACATCGCTTT GATGGAGCTC TGCGGAGAGC SSSS^G 
1651 AAGAGCAAGA CGGACCTGCT CCACCCAGAG GAGGCGGAGG ScUcSSc 

™ £2S£ sse ssss ssss c 

1801 IT CTACA T CC GTCGCATGGT SS3SSS SEES 
1851 ATCACACTGG CGGCCGCTCG AGCATGCATC TAGAGGGCCC SJSSSg 
^CACCTAA ATGCSAGAGC TCGCTGATCA GCCTCGACTG JStcSS 
1951 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTgSSSS 
2001 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAAtSS 
2051 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TgSSgS 
2101 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCAtS SSSS 
2151 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG 
2201 TATCCCCACG CGCCCTGXAG CGGCGCATTA AGCGCGGcS SSgSgIt 
2251 TACGCGCAGC GTGACCGCZA CACTTGCCAG CGCCCTAGCG 
2301 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCoScS 
2351 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG ctSSSSJ 
2401 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT SSSSS 
2451 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CAcSSS 
2501 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT 
2551 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TA^gSKI 
2601 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT S5SSSS 
2651 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCaS SSgSgA^S 
2701 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAaSSSc 
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2751 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT raaw^r-^^ 
SSS 0 ™ TCCCGCCCCT AACTCCGCCC 5S£S S£5c2£ 
™J CCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT 
2901 CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTrn^lt tZZVZ 
2951 GGCTTTTTTG GAGGCC TAGG CTtSgSS SStSSS 
3001 ATCCATTTTC GGATCTGATC AAGAGACAGG US2££ SSStga 
3051 TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCXTG 
£5 ^r CGGCT ATeACT ^C ACAACAGACA ATcSSS SSSSg 
3151 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT SSSSSSS 
SS TGCCCT ^ GAACTGCAGG SSSSSS 

«S ^ CTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG AcSSSSS 
3301 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG 
3351 TCCTGTCATC TCACCTTGCT CCTGCCGAGA aS£S£5 SSSSS 
3401 GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC 
3451 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG SSSSS 
3501 TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT SJ^SScC 
^r TTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG aSSSSS 
3601 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCn 
3651 GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGG? SJSgSS 
3701 CAGGACATAG CGTTGGCTAC CCGTGATATT GC TGAAGAGC 
llni ^ GCTGAC CGCTT CCTCG TGCTTTACGG TATCGCOGCT CCcSS^ 
3801 AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGcSSSr 
3851 TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC A^CA^SSt 
llll CCGCCSCCTT CTATGAAAGG TTGGGCTTCG SSSSSS 

3951 CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGaS 
4001 TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG iESSSS 
4051 AGCAATAGCA TCACAAATTT CACAAATAaJ SSSiS? S££S5£ 

4101 tagttgtggt ttgtccaaac tcatcaatgt atcttScS ctSgSJa? 

4151 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA 
4201 GTGTGAAATT GTTATCCGCT CACAATXCCA CACAACAtIc 
4251 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA SScSrlt 
4301 TTGCGTTGCG CTCACTGCCC GCXTTCCAGT CGGGAAACCT SS^CCA^ 
"51 CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGaScSgS SSSSSS 
4401 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG gSSSS 
4451 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG SS 
4501 GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG eSSSS 
12? GGGC ^ GGAAC CGTAAAAAGG CCGCGTTGCX gSSSJ^J CaSSJSS 
4601 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA SSSSSS 
4651 AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 

751 1 SSSS SSSH CCCTGCCGCT »ssss ssss 
48o 5 i 5S2SS SSSSS SSSS SSSSSS SSSSE 

4851 CCCCGTTCAG CCCGACCGCT GCGCCTTATC SS5S55 SSJSJS 
4901 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGGAGC SSStA^C 
AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTAcSS SSSag^G 
SSSSS^ TACGGCTACA CTAGAAGGAC AGTATTTGGT SSSSSS 
5051 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCcSr 
5101 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA A^S^™ 
5151 TACGCGCAGA AAAAAAGGAT CTCAAGAaS ^SSg 
5201 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGgSS StSSS 
5251 AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATO AAA^Sgaa^ 
lltl SSS^ ATCTAAAGTA TATATGAGTA AACTTGGTCT £££££ 
2S" AA ^ GCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTtS 
5401 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGgXgS 
ItS °^ AC ,™ OOOCC ««~ CTGCAATGAT ACCGCGaS cSSSSc 
5501 CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCcSgSc 
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5551 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG 
5601 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 
5651 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 
5701 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 
5751 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 
5801 GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT 
5851 TCTCTTACTG TGATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 
5901 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 
5951 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 
6001 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATC TT 
6051 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 
6101 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 
6151 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GC GACACGGA AATGTTGAAT 
6201 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 
6251 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 
6301 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TCGACGGATC 
6351 GGGAGATCTC CCGATCCCCT ATGGTCGACT CTCAGTACAA TCTGCTCTGA 
6401 TGCCGCATAG TTAAGCCAGT ATCTGCTCCC TGCTTGTGTG TTGGAGGTCG 
6451 CTGAGTAGTG CGCGAGCAAA ATTTAAGCTA CAACAAGGCA AGGCTTGACC 
6501 GACAATTGCA TGAAGAATCT GCTTAGGGTT AGGCGTTTTG CGCTGCTTCG 
6551 CGATGTACGG GCCAGATATA CGCGTTGACA TTGATTATTG AC TAGTTATT 
6601 AATAGTAATC AATTACGGGG TGATTAGTTC ATAGCCCATA TATGGAGTTC 
6651 CGCGTTACAT AACTTACGGT AAATGGCCCG CCTGGCTGAC CGCCCAACGA 
6701 CCCCCGCCCA TTGACGTCAA TAATGACGTA TGTTCCCATA GTAACGCCAA 
6751 TAGGGAC TTT CCATTGACGT CAATGGGTGG ACTATTTACG GTAAACTGCC 
6801 CACTTGGCAG TACATCAAGT GTATCATATG CCAAGTACGC CCCCTATTGA 
6851 CGTCAATGAC GGTAAATGGC CCGCCTGGCA TTATGCCCAG TACATGACCT 
6901 TATGGGACTT TCCTACTTGG CAGTACATCT ACGTATTAGT CATCGCEATT 
6951 ACCATGGTGA TGCGGTTTTG GCAGTACATC AATGGGCGTG GATAGCGGTT 
7001 TGACTCACGG GGATTTCCAA GTCTCCACCC CATTGACGTC AATGGGAGTT 
7051 TGTTTTGGCA CCAAAATCAA CGGGACTTTC CAAAATGTCG TAACAACTCC 
7101 GCCCCATTGA CGCAAATGGG CGGTAGGCGT GTACGGTGGG AGGTCTATAT 
7151 AAGCAGAGCT CTCTGGCTAA CTAGAGAACC CACTGCTTAC TGGCTTATCG 
7201 AAATTAATAC GACTCACTAT AGGGAGACCC AAGCTTGGTA CC 
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pCHIC (SEQ ID NO: 10) 

1 ATGCTGTGCT GTATGAGAAG AAC CAAACA G GTTGAAAAGA ATGATPArrA 
51 CCAAAAGATC ATGGTGAGCA AGGGCGAGGA GCTG^Acfc GGGgStTc 
101 CCATCCTGGT CGAGCTGGAC GGCGACGTAA ACGGCCaSS. SSSSL 
151 TCCGGCGAGG GCGAGGGCGA TGCCACCTAC GGCAAGCTGA SSSSSS 
201 CATCTGCACC ACCGGCAAGC TGCCCGTGCC CTGGCCCACC CTCCTgIcS 
251 CCTTCGGCTA CGGCCTGCAG TGCTTCGCCC GCTACCCCGA CCAcISS? 
301 CAGCACGACT TCTTCAAGTC CGCCATGCCC GAAGGctSg SSSSKcl 
351 CACCATCTTC TTCAAGGACG ACGGCAACTA CAAGACCcS Icccttrvri 
4 01 AGTTCGAGGG CGACACCCTG GTGAACCGCA TctSSSX GgScgS 

4 51 TTCAAGGAGG ACGGCAACAT CCTGGGGCAC AAGCTGGACT AcScS 
501 CAGCCACAAC GTCTATATCA TGGCCGACAA GCAGAAGAAC S^SagS 
551 TGAACTTCAA GATCCGCCAC AACATCGAGG ACGGCAGCCT GcS^CC 
601 GACCACTACC AGCAGAACAC CCCCATCGGC GACGGCCCCG TGCTGCTGCP 
651 CGACAACCAC TACCTGAGCT ACCAGTCCGC CCTGAgSS GACcScG 
701 AGAAGCGCGA TCACATGGTC CTGCTGGAGT TCGTGACCGC SS^r 
751 ACTCTCGGCA TGGACGAGCT GTACGCGATC GCATCTcSg CcSgSSa^ 

801 gcaaaagcag gcggaacatg tccccccgta tgatgtgSg SctStgS 

5 ^^ TGTGGT GCT( 5GTGGGA CCCTCTCTGA AAGGTTATGA ScaSSc 
901 ATGATGCAGA AGGCTCTCTT CGACTTCCTT AAACACAGGT TTGATGGCAG 
951 GATCTCCATC ACCCGCGTCA CGGCTGACCT CTCACTGGCC AAGCgSSg 

1001 TGCTCAACAA TCCTGGCAAG AGGACCATCA TCGAGCGCTC TTCTGCXXGC 
1051 TCCAGCATTG CTGAGGTGCA GAGTGAGATT GAGCGCATAT tcSgSgGC 
1101 CAAATCCCTG CAGCTAGTGG TGTTGGATGC TGaScGATC SSSSSg 
1151 CACAGCTAGC CAAGACCTCA CTGGCCCCCA TCATCGTCTT CgSJSSg 
1201 TCCTCGCCAA AGGTACTGCA GCGACTGATC CGCTCCAGGG SSJSK 
lim XSES* 0 CTCACTG ™ G AGATGATGGC ATATGAtSg SScAgJ 
1301 GCCCACCTGA GTCATTTGAT GTGATTCTGG ATGAGAACCA GCTGclcrtr 
1351 GCCTGTGAGC ACCTAGCTGA ATACCTAGAG GT^GGc" GCGcSSa 
1401 CCACCCAGCA CCGGGCCCCG GGATGCTGGG TCCGCCCAGT GcSSSS 
1451 GACTTCAGAA CCAGCAGCTG CTGGGGGAGC GAGGTGAGGA GcS^CCC 
JXJ ^ G ^ GCGGG ACAGT ^GAT GCCCTCGGAT GAGGCCAgS SSJcCG 
1551 CCAGGCCTGG ACCGGATCTT CACAGCGCAG CTCCCGCCAT CTGCAPPAPP 
1601 ACTATGCAGA TGCCTACCAG GACCTGTACC AGCCTcSSg tcSScC 
1651 TCGGGGCTAC CCAGTGCTAA CGGGCATGAC CCCCMGACC gSJSSgc 
n^ ACTCG GAGCATGACG ACAATGACCG GAACTGGCAG cSSSgGC 
1751 CTTGGCCTAA GGACAGCTAC GAATTCGCCA AAGAAAGGGA GCGGGtSc 
1801 AACCGGCGCG CATTCCTGAA GCTGCGGCGG CAGCAGCAGA ScA^rr?? 
1851 GCTCAACGGG TACATGGAGT GGATCTCA^A SSSSSaG Sg^cSS 
1901 CAGAGGACGA GACCGACGTG GAGCAGAGAC ATCCCTTTGA TGGAGCTCTG 
1951 CGGAGAGCCA CTATCAAGAA GAGCAAGACG GACCTGCTCC I^cJagIgGA 
2001 GGCGGAGGAT CAGCTGGCCG ACATCGCCTC CGTGGGGTCT JccStgS2 
2051 GAGCCAGCAT TAAAAGTGCC AAGCTGGAGA ACTCGAGTTT SSSXS 
2101 AAAGAGAGGA GAATGCGTTT CTACATCCGT CGCATGGTCA IaIcTC^ 
IIS ^ A J GGTG AGCAAGGGGG AGGAGCTGTT CACCGGGGTG G^cSSc 
2201 TGGTCGAGCT GGACGGCGAC GTAAACGGCC ACAGGTTCAG CGTGTrrrrr 

llll r A rS^ AGG GCGATGCCAG CTACGGCAAG JSaSJgA AG^cSSg 
II J AAGCTGCCCG TGCCCTGGCC CACCCTCGTG ACCACcSgA 

240 SSSS SS5™ AGCCGCTACC CCGACCACAT GaScaSaJ 
till SJSSISg GCCCGAAGGC TACGTCCAGG AGCGCACCAT 

oc^T CTTCTTCAAG GACGACGGCA ACTACAAGAC CCGCGCCGAG GTGAAGTTCG 
2501 AGGGCGACAC CCTGGTGAAC CGCATCGAGC TGAAGGGCAT CGActSmc 
2551 GACGACGGCA ACATCCTGGG GCACAAGCTG GAGTACAACT SJSIgc^A 

i acaagcagaa SSSSSS 

2701 ?A??A?J^ G C £ ACAACATC GAG GACGGCA GCGTGCAGCT CGCCGACCAC 
2701 TACCAGCAGA ACACCCCCAT CGGCGACGGC CCCGTGCTGC TGGCCGACAA 
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2751 
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2951 
3001 
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3951 
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4501 
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4751 
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4851 
4901 
4951 
5001 
5051 
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5201 
5251 
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5501 



CCACTACCTG 
GCGATCACAT 
GGCAGTTAAC 
GCATCACAAA 
GGTTTGTCCA 
ATATTTTGTT 
AACCAATAGG 
CGAGATAGGG 
AGAACGTGGA 
GGCCCACTAC 
CCGTAAAGCA 
GACGGGGAAA 
GGAGCGGGCG 
CACCACACCC 
CTTTTCGGGG 
CATTCAAATA 
ATAATATTGA 
TGTGTGTCAG 
GTATGCAAAG 
CCAGGCTCCC 
AGCAACCATA 
CCAGTTCCGC 
GCAGAGGCCG 
AGGCTTTTTT 
TGAGGATCGT 
GGCCGCTTGG 
TCGGCTGCTC 
GTTCTTTTTG 
CGAGGCAGCG 
CTGTGCTCGA 
GAAGTGCCGG 
AGTATCCATC 
CTACCTGCCC 
ACTCGGATGG 
TCAGGGGCTC 
CCGACGGCGA 
ATCATGGTGG 
GGGTGTGGCG 
CTGAAGAGCT 
ATCGCCGCTC 
GTTCTTCTGA 
CAACCTGCCA 
TGGGCTTCGG 
GGGGATCTCA 
AACACGGAAG 
AAAGACAGAA 
GTTCGGTCCC 
GGGCCAATAC 
CGGGTGAAGG 
ATAGCCTCAG 
TTAATTTAAA 
AAATCCCTTA 
AAGATCAAAG 
CTTGCAAACA 
AAGAGCTACC 
ATACCAAATA 



AGCACCCAGT 
GGTCCTGCTG 
TTGTTTATTG 
TTTCACAAAT 
AACTCATCAA 
AAAATTCGCG 
CCGAAATCGG 
TTGAGTGTTG 
CTCCAACGTC 
GTGAACCATC 
CTAAATCGGA 
GCCGGCGAAC 
CTAGGGCGCT 
GCCGCGCTTA 
AAATGTGCGC 
'TGTATCCGCT 
AAAAGGAAGA 
TTAGGGTGTG 
CATGCATCTC 
CAGCAGGCAG 
GTCCCGCCCC 
CCATTCTCCG 
AGGCCGCCTC 
GGAGGCCTAG 
TTCGCATGAT 
GTGGAGAGGC 
TGATGCCGCC 
TCAAGACCGA 
CGGCTATCGT 
CGTTGTCACT 
GGCAGGATCT 
ATGGCTGATG 
ATTCGACCAC 
AAGCCGGTCT 
GCGCCAGCCG 
GGATCTCGTC 
AAAATGGCCG 
GACCGCTATC 
TGGCGGCGAA 
CCGATTCGCA 
GCGGGACTCT 
TCACGAGATT 
AATCGTTTTC 
TGCTGGAGTT 
GAGACAATAC 
TAAAACGCAC 
AGGGCTGGCA 
GCCCGCGTTT 
CCCAGGGCTC 
GTTACTCATA 
AGGATCTAGG 
ACGTGAGTTT 
GATCTTCTTG 
AAAAAACCAC 
AACTCTTTTT 
CTGTCCTTCT 



CCGCCCTGAG 
GAGTTCGTGA 
CAGCTTATAA 
AAAGCATTTT 
TGTATCTTAA 
TTAAATTTTT 
CAAAATCCCT 
TTCCAGTTTG 
AAAGGGCGAA 
ACCCTAATCA 
ACCCTAAAGG 
GTGGCGAGAA 
GGCAAGTGTA 
ATGCGCCGCT 
GGAACCCCTA 
CATGAGACAA 
GTCCTGAGGC 
GAAAGTCCCC 
AATTAGTCAG 
AAGTATGCAA 
TAACTCCGCC 
CCCCATGGCT 
GGCCTCTGAG 
GCTTTTGCAA 
TGAACAAGAT 
TATTCGGCTA 
GTGTTCCGGC 
CCTGTCCGGT 
GGCTGGCCAC 
GAAGCGGGAA 
CCTGTCATCT 
CAATGCGGCG 
CAAGCGAAAC 
TGTCGATCAG 
AACTGTTCGC 
GTGACCCATG 
CTTTTCTGGA 
AGGACATAGC 
TGGGCTGACC 
GCGCATCGCC 
GGGGTTCGAA 
TCGATTCCAC 
CGGGACGCCG 
CTTCGCCCAC 
CGGAAGGAAC 
GGTGTTGGGT 
CTCTGTCGAT 
CTTCCTTTTC 
GCAGCCAACG 
TATACTTTAG 
TGAAGATCCT 
TCGTTCCACT 
AGATCCTTTT 
CGCTACCAGC 
CCGAAGGTAA 
AGTGTAGCCG 



CAAAGACCCC 
CCGCCGCCGG 
TGGTTACAAA 
TTTCACTGCA 
GGCGTAAATT 
GTTAAATCAG 
TATAAATCAA 
GAACAAGAGT 
AAACCGTCTA 
AGTTTTTTGG 
GAGCCCCCGA 
AGGAAGGGAA 
GCGGTCACGC 
ACAGGGCGCG 
TTTGTTTATT 
TAACCCTGAT 
GGAAAGAACC 
AGGCTCCCCA 
CAACCAGGTG 
AGCATGCATC 
CATCCCGCCC 
GACTAATTTT 
CTATTCCAGA 
AGATCGATCA 
GGATTGCACG 
TGACTGGGCA 
TGTCAGCGCA 
GCCCTGAATG 
GACGGGCGTT 
GGGACTGGCT 
CACCTTGCTC 
GCTGCATACG 
ATCGCATCGA 
GATGATCTGG 
CAGGCTCAAG 
GCGATGCCTG 
TTCATCGACT 
GTTGGCTACC 
GCTTCCTCGT 
TTCTATCGCC 
ATGACCGACC 
CGCCGCCTTC 
GCTGGATGAT 
CCTAGGGGGA 
CCGCGCTATG 
CGTTTGTTCA 
ACCCCACCGA 
CCCACCCCAC 
TCGGGGCGGC 
ATTGATTTAA 
TTTTGATAAT 
GAGCGTCAGA 
TTTCTGCGCG 
GGTGGTTTGT 
CTGGCTTCAG 
TAGTTAGGCC 



AAGGAGAAGC 
GATCACTCTC 
TAAAGCAATA 
TTCTAGTTGT 
GTAAGCGTTA 
CTCATTTTTT 
AAGAATAGAC 
CCACTATTAA 
TCAGGGCGAT 
GGTCGAGGTG 
TTTAGAGCTT 
GAAAGCGAAA 
TGCGCGTAAC 
TCAGGTGGCA 
TTTCTAAATA 
AAATGCTTCA 
AGCTGTGGAA 
GCAGGCAGAA 
TGGAAAGTCC 
TCAATTAGTC 
CTAACTCCGC 
TTTTATTTAT 
AGTAGTGAGG 
AGAGACAGGA 
CAGGTTCTCC 
CAACAGACAA 
GGGGCGCCCG 
AACTGCAAGA 
CCTTGCGCAG 
GCTATTGGGC 
CTGCCGAGAA 
CTTGATCCGG 
GCGAGCACGT 
ACGAAGAGCA 
GCGAGCATGC 
CTTGCCGAAT 
GTGGCCGGCT 
CGTGATATTG 
GCTTTACGGT 
TTCTTGACGA 
AAGCGACGCC 
TATGAAAGGT 
CCTCCAGCGC 
GGCTAACTGA 
ACGGCAATAA 
TAAACGCGGG 
GACCCCATTG 
CCCCCAAGTT 
AGGCCCTGCC 
AACTTCATTT 
C7CATGACCA 
CCCCGTAGAA 
TAATCTGCTG 
TTGCCGGATC 
CAGAGCGCAG 
ACCACTTCAA 
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5551 GAACTCTGTA GCACCGCCTA CATACCTCGC TCTGCTAATC CTGTTACCAG 
5601 TGGCTGCTGC CAGTGGCGAT AAGTCGTGTC TTACCGGGTT GGACTCAAGA 
5651 CGATAGTTAC CGGATAAGGC GCAGCGGTCG GGCTGAACGG GGGGTTCGTG 
5701 CACACAGCCC AGCTTGGAGC GAACGACCTA CACCGAACTG AGATACCTAC 
5751 AGCGTGAGCT ATGAGAAAGC GCCACGCTTC CCGAAGGGAG AAAGGCGGAC 
5801 AGGTATCCGG TAAGCGGCAG GGTCGGAACA GGAGAGCGCA CGAGGGAGCT 
5851 TCCAGGGGGA AACGCCTGGT ATCTTTATAG TCCTGTCGGG TTTCGCCACC 
5901 TCTGACTTGA GCGTCGATTT TTGTGATGCT CGTCAGGGGG GCGGAGCCTA 
5951 TGGAAAAACG CCAGCAACGC GGCCTTTTTA CGGTTCCTGG CCTTTTGCTG 
6001 GCCTTTTGCT CACATGTTCT TTCCTGCGTT ATCCCCTGAT TCTGTGGATA 
6051 ACCGTATTAC CGCCATGCAT TAGTTATTAA TAGTAATCAA TTACGGGGTC 
6101 ATTAGTTCAT AGCCCATATA TGGAGTTCCG CGTTACATAA CTTACGGTAA 
6151 ATGGCCCGCC TGGCTGACCG CCCAACGACC CCCGCCCATT GACGTCAATA 
6201 ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC ATTGACGTCA 
6251 ATGGGTGGAG TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 
6301 ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC 
6351 GCCTGGCATT ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA 
6401 GTACATCTAC GTATTAGTCA TCGCTATTAC CATGGTGATG CGGTTTTGGC 
6451 AGTACATCAA TGGGCGTGGA TAGCGGTTTG ACTCACGGGG ATTTCCAAGT 
6501 CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC AAAATCAACG 
6551 GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 
6601 GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTGG TTTAGTGAAC 
6651 CGTCAGATCC GCTAGCGCTA CCGGACTCAG ATCTCGAGCT CAAGCTTCGA 
6701 ATTCTGCAGT CGACGGTACC GCGGGCCCGG GATCCACCGG TCGCCACC 
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<110> Commissariat a 1'Energie Atomique 

institut National de la Sante et de la Recherche Medicale 

DE WAARD, Michel 

DUPUIS, Alain 
GRUNWALD, Didier 
SAND02, Guillaume 



<130> 263PCT87 

<160> 10 

<170> Patentln version 3.1 

<210> 1 

<211> 58 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 1 

tttggtacca tggatgacga ctcctacgtg cccgggtttg aggactcgga ggcgggtt 58 



<210> 


2 


<211> 


48 


<212> 


DNA 


<213> 


artificial 


<220> 





<223> amorce 




d'antagonistes des 
s couples aux 
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<400> 2 

gcggaattcg tagctgtcct taggccaagg ccggttacgc tgccagtt 

<210> 3 

<211> 36 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 3 

ggggaattcg ccaaagaaag ggagcgggtg gagaac 

<210> 4 

<211> 51 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 4 

tttgaattct tactgagttt tgaccatgcg acggatgtag aaacgcattc t 

<210> 5 

<211> 7242 

<212> DNA 

<.213^ artificial sequence 



<220> 

<223> plasmide recombinant 
<400> 5 

*tgga*§aeg actcctacgt gcccgggttt gaggactcgg aggcgggttc agccgactcc 60 

tacac^gptt ©cccctctct ggactcagac gtttccctgg aggaggaccg ggagagtgcc 120 

cggcgagaag tggagagtca ggctcagcag cagctggaaa gagccaagca caaacctgtg 180 

gcatttgctg tgaggaccaa tgtcagctac tgtggagttc tggatgagga atgcccagtc 240 

,_*ggqctctg gagtcaactt cgaggccaaa gattttctgc acattaaaga gaagtacagc 300 

asmgactggt ggatcgggag gctagtgaaa gaaggtggcg atattgcctt catccccagc 360 

ccccaacgcc tggagagcat ccggctcaaa caggaacaga aggccaggag atccgggaac 420 
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ccttccagcc tgagtgacat tggcaaccga cgttcccctc ctccatctct agccaagcag 480 

aagcaaaagc aggcggaaca tgtccccccg tatgatgtgg tgccctccat gcggcctgtg 540 

gtgctggtgg gaccctctct gaaaggttat gaggtcacag acatgatgca gaaggctctc 600 

ttcgacttcc ttaaacacag gtttgatggc aggatctcca tcacccgcgt cacggctgac 660 

ctctcactgg ccaagcgctc tgtgctcaac aatcctggca agaggaccat catcgagcgc 720 

tcttctgccc gctccagcat tgctgaggtg cagagtgaga ttgagcgcat attcgagctg 780 

gccaaatccc tgcagctagt ggtgttggat gctgacacca tcaaccaccc agcacagcta 840 

gccaagacct cactggcccc catcatcgtc ttcgtcaaag tgtcctcgcc aaaggtactg 900 

cagcgactga tccgctccag ggggaagtcc cagatgaagc acctcactgt acagatgatg 960 

gcatatgata agctggttca gtgcccacct gagtcatttg atgtgattct ggatgagaac 1020 

cagctggacg acgcctgtga gcacctagct gaatacctag aggtttactg gcgcgctacc 1080 

caccacccag caccgggccc cgggatgctg ggtccgccca gtgccatccc tggacttcag 1140 

aaccagcagc tgctggggga gcgaggtgag gagcattcac ccctggagcg ggacagtttg 1200 

atgccctcgg atgaggccag tgagagctcc cgccaggcct ggaccggatc ttcacagcgc 1260 

agctcccgcc atctggagga ggactatgca gatgcctacc aggacctgta ccagcctcac 1320 

cgtcaacaca cctcggggct acccagtgct aacgggcatg acccccaaga ccggctccta 1380 

gcccaggact cggagcatga ccacaatgac cggaactggc agcgtaaccg gccttggcct 1440 

aaggacagct acgaattcgc caaagaaagg gagcgggtgg agaaccggcg cgcattcctg 1500 

aagctgcggc ggcagcagca gattgaacgc gagctcaacg ggtacatgga gtggatctca 1560 

aaagcagaag aggtgatcct cgcagaggac gagaccgacg tggagcagag acatcccttt 1620 

gatggagctc tgcggagagc cactatcaag aagagcaaga cggacctgct ccacccagag 1680 

gaggcggagg atcagctggc cgacatcgcc tccgtggggt ctccctttgc ccgagccagc 1740 

attaaaagtg ccaagctgga gaactcgagt tttttccaca aaaaagagag gagaatgcgt 1800 

ttctacatcc gtcgcatggt caaaactcag taagaattct gcagatatcc atcacactgg 1860 

cggccgctcg agcatgcatc tagagggccc tattctatag tgtcacctaa atgctagagc 1920 

tcgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 1980 

cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 2040 

aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 2100 

cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat 2160 

ggcttctgag gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag 2220 

cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag 2280 

cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt 2340 

tccccgtcaa gctctaaatc ggggcatccc tttagggttc cgatttagtg ctttacggca 2400 

cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata 2460 
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gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca 2520 

aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag ggattttggg 2580 

gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt 2640 

ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagg caggcagaag 2700 

tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 2760 

agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 2820 

aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 2880 

actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa 2940 

gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg gagcttgtat 3000 

atccattttc ggatctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga 3060 

tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc 3120 

acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc 3180 

ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg acgaggcagc 3240 

gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac 3300 

tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc 3360 

tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac 3420 

gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg 3480 

tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct 3540 

cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt 3600 

cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 3660 

attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 3720 

ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 3780 

tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 3840 

agcgggactc tggggttcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat 3900 

ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc 3960 

ggctggatga tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg 4020 

tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 4080 

gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat 4140 

gtctgtatac cgtcgacctc tagctagagc ttggcgtaat catggtcata gctgtttcct 4200 

gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt 4260 

aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc 4320 

gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 4380 

agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 4440 

gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 4500 
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gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 4560 

cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 4620 

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 4680 

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 4740 

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 4800 

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 4860 

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 4920 

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 4980 

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 5040 

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 5100 

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 5160 

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 5220 

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 5280 

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 5340 

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 5400 

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 5460 

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 5520 

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 5580 

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 5640 

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 5700 

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 5760 

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 5820 

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 5880 

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 5940 

l^ctc-r— gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 6000 

gtgcxcaccct ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 6060 

aaatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 6120 

ac^a^c^- -"SOTtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 6180 

/•cqaLcL,^; ^J^ttgaat actcatactc ttcctttttc aatattattg aagcatttat 6240 

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 6300 

ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tcgacggatc gggagatctc 6360 

x^-jatcccct atggtcgact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 6420 

c-i-£t^<recLt egcttgtgtg ttggaggtcg ctgagtagtg cgcgagcaaa atttaagcta 6480 

taacaaggca aggcttgacc gacaattgca tgaagaatct gcttagggtt aggcgttttg 6540 
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cgctgcttcg cgatgtacgg gccagatata cgcgttgaca ttgattattg actagttatt 6600 

aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat 6660 

aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 6720 

taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 6780 

actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 6840 

cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6900 

tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6960 

tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 7020 

gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 7080 

caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 7140 

aggtctatat aagcagagct ctctggctaa ctagagaacc cactgcttac tggcttatcg 7200 

aaattaatac gactcactat agggagaccc aagcttggta cc 7242 

<210> 6 
<211> 39 
<212> DNA 

<213> artificial sequence 



<220> 

<223> amorce 
<400> 6 

agccgtacgc gatcgcatct ctagccaagc agaagcaaa 

<210> 7 

<211> 42 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 7 

cccgttaacc ccactagtct gagttttgac catgcgacgg at 

<210> 8 
<211> 33 
<212> DNA 
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<220> 

<223> amorce 
<400> 8 

gggactagta tggtgagcaa gggcgaggag ctg 3 

<210> 9 

<211> 34 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce 

<400> 9 

cccgttaact gccgagagtg atcccggcgg cggt ^ 

<210> 10 
<211> 7242 
<212> DNA 

<213> artificial sequence 
<220> 

<223> plasmide recombinant 
<400> 10 

atggatgacg actcctacgt gcccgggttt gaggactcgg aggcgggttc agccgactcc 60 

tacaccagcc gcccctctct ggactcagac gtttccctgg aggaggaccg ggagagtgcc 120 

r^gcgagaag tggagagtca ggctcagcag cagctggaaa gagccaagca caaacctgtg 180 

gcatttgctg tgaggaccaa tgtcagctac tgtggagttc tggatgagga atgcccagtc 240 

cagggctctg gagtcaactt cgaggccaaa gattttctgc acattaaaga gaagtacagc 300 

aatgactggt ggatcgggag gctagtgaaa gaaggtggcg atattgcctt catccccagc 360 

cccosa^r --99agagcat ccggctcaaa caggaacaga aggccaggag atccgggaac 420 

ccttccagcc tgagtgacat tggcaaccga cgttcccctc ctccatctct agccaagcag 480 

aagcaaaagc aggcggaaca tgtccccccg tatgatgtgg tgccctccat gcggcctgtg 540 

•9*3ctggtgg gaccctctct gaaaggttat gaggtcacag acatgatgca gaaggctctc 600 

ttcgacttcc ttaaacacag gtttgatggc aggatctcca tcacccgcgt cacggctgac 660 

ctctcactgg ccaagcgctc tgtgctcaac aatcctggca agaggaccat catcgagcgc 720 
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tcttctgccc 
gccaaatccc 
gccaagacct 
cagcgactga 
gcatatgata 
cagctggacg 
caccacccag 
aaccagcagc 
atgccctcgg 
agctcccgcc 
cgtcaacaca 
gcccaggact 
aaggacagct 
aagctgcggc 
aaagcagaag 
gatggagctc 
gaggcggagg 
attaaaagtg 
ttctacatcc 
cggccgctcg 
tcgctgatca 
cgtgccttcc 
aattgcatcg 
cagcaagggg 
ggcttctgag 
cggcgcatta 
cgccctagcg 
tccccgtcaa 
cctcgacccc 
gacggttttt 
aactggaaca 
gatttcggcc 
ctgtggaatg 
tatgcaaagc 



gctccagcat 
tgcagctagt 
cactggcccc 
tccgctccag 
agctggttca 
acgcctgtga 
caccgggccc 
tgctggggga 
atgaggccag 
atctggagga 
cctcggggct 
cggagcatga 
acgaattcgc 
ggcagcagca 
aggtgatcct 
tgcggagagc 
atcagctggc 
ccaagctgga 
gtcgcatggt 
agcatgcatc 
gcctcgactg 
ttgaccctgg 
cattgtctga 
gaggattggg 
gcggaaagaa 
agcgcggcgg 
cccgctcctt 
gctctaaatc 
aaaaaacttg 
cgccctttga 
acactcaacc 
tattggttaa 
tgtgtcagtt 
atgcatctca 



tgctgaggtg 
ggtgttggat 
catcatcgtc 
ggggaagtcc 
gtgcccacct 
gcacctagct 
cgggatgctg 
gcgaggtgag 
tgagagctcc 
ggactatgca 
acccagtgct 
ccacaatgac 
caaagaaagg 
gattgaacgc 
cgcagaggac 
cactatcaag 
cgacatcgcc 
gaactcgagt 
caaaactcag 
tagagggccc 
tgccttctag 
aaggtgccac 
gtaggtgtca 
aagacaatag 
ccagctgggg 
gtgtggtggt 
tcgctttctt 
ggggcatccc 
attagggtga 
cgttggagtc 
ctatctcggt 
aaaatgagct 
agggtgtgga 
attagtcagc 



cagagtgaga 
gctgacacca 
ttcgtcaaag 
cagatgaagc 
gagtcatttg 
gaatacctag 
ggtccgccca 
gagcattcac 
cgccaggcct 
gatgcctacc 
aacgggcatg 
cggaactggc 
gagcgggtgg 
gagctcaacg 
gagaccgacg 
aagagcaaga 
tccgtggggt 
tttttccaca 
taagaattct 
tattctatag 
ttgccagcca 
tcccactgtc 
ttctattctg 
caggcatgct 
Ctctaggggg 
tacgcgcagc 
cccttccttt 
tttagggttc 
tggttcacgt 
cacgttcttt 
ctattctttt 
gatttaacaa 
aagtccccag 



aaccaggtgt 
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ttgagcgcat 
tcaaccaccc 
tgtcctcgcc 
acctcactgt 
atgtgattct 
aggtttactg 
gtgccatccc 
ccctggagcg 
ggaccggatc 
aggacctgta 
acccccaaga 
agcgtaaccg 
agaaccggcg 
ggtacatgga 
tggagcagag 
cggacctgct 
ctccctttgc 
aaaaagagag 
gcagatatcc 
tgtcacctaa 
tctgttgttt 
ctttcctaat 
99gggtgggg 
ggggatgcgg 
tatccccacg 
gtgaccgcta 
ctcgccacgt 
cgatttagtg 
agtgggccat 
aatagtggac 
gatttataag 
aaatttaacg 
gctccccagg 
ggaaagtccc 



attcgagctg 
agcacagcta 
aaaggtactg 
acagatgatg 
ggatgagaac 
gcgcgctacc 
tggacttcag 
ggacagtttg 
ttcacagcgc 
ccagcctcac 
ccggctccta 
gccttggcct 
cgcattcctg 
gtggatctca 
acatcccttt 
ccacccagag 
ccgagccagc 
gagaatgcgt 
atcacactgg 
atgctagagc 
gcccctcccc 
aaaatgagga 
tggggcagga 
tgggctctat 
cgccctgtag 
cacttgccag 
tcgccggctt 
ctttacggca 
cgccctgata 
tcttgttcca 
ggattttggg 
cgaattaatt 
caggcagaag 
caggctcccc 



780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
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agcaggcaga 
aactccgccc 
actaattttt 
gtagtgagga 
atccattttc 
tggattgcac 
acaacagaca 
ggttcttttt 
gcggctatcg 
tgaagcggga 
tcaccttgct 
gcttgatccg 
tactcggatg 
cgcgccagcc 
cgtgacccat 
attcatcgac 
ccgtgatatt 
tatcgccgct 
agcgggactc 
ttcgattcca 
ggctggatga 
tttattgcag 
gcattttttt 
gtctgtatac 
gtgtgaaatt 
aaagcctggg 
gctttccagt 
agaggcggtt 
gtcgttcggc 
gaatcagggg 
cgtaaaaagg 
aaaaatcgac 
tttccccctg 
ctgtccgcct 



agtatgcaaa 
atcccgcccc 
tttatttatg 
ggcttttttg 
ggatctgatc 
gcaggttctc 
atcggctgct 
gtcaagaccg 
tggctggcca 
agggactggc 
cctgccgaga 
gctacctgcc 
gaagccggtc 
gaactgttcg 
ggcgatgcct 
tgtggccggc 
gctgaagagc 
cccgattcgc 
tggggttcga 
ccgccgcctt 
tcctccagcg 
cttataatgg 
cactgcattc 
cgtcgacctc 
gttatccgct 
gtgcctaatg 
cgggaaacct 
tgcgtattgg 
tgcggcgagc 
ataacgcagg 
ccgcgttgct 
gctcaagtca 
gaagctccct 
ttctcccttc 



gcatgcatct 
taactccgcc 
cagaggccga 
gaggcctagg 
aagagacagg 
cggccgcttg 
ctgatgccgc 
acctgtccgg 
cgacgggcgt 
tgctattggg 
aagtatccat 
cattcgacca 
ttgtcgatca 
ccaggctcaa 
gcttgccgaa 
tgggtgtggc 
ttggcggcga 
agcgcatcgc 
aatgaccgac 
ctatgaaagg 
cggggatctc 
ttacaaataa 
tagttgtggt 
tagctagagc 
cacaattcca 
agtgagctaa 
gtcgtgccag 
gcgctcttcc 
ggtatcagct 
aaagaacatg 
ggcgtttttc 
gaggtggcga 
cgtgcgctct 
gggaagcgtg 



caattagtca 
cagttccgcc 
ggccgcctct 
cttttgcaaa 
atgaggatcg 
ggtggagagg 
cgtgttccgg 
tgccctgaat 
tccttgcgca 
cgaagtgccg 
catggctgat 
ccaagcgaaa 
ggatgatctg 
ggcgcgcatg 
tatcatggtg 
ggaccgctat 
atgggctgac 
cttctatcgc 
caagcgacgc 
ttgggcttcg 
atgctggagt 
agcaatagca 
ttgtccaaac 
ttggcgtaat 
cacaacatac 
ctcacattaa 
ctgcattaat 
gcttcctcgc 
cactcaaagg 
tgagcaaaag 
cataggctcc 
aacccgacag 
cctgttccga 



gcgctttctc 
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gcaaccatag 
cattctccgc 
gcctctgagc 
aagctcccgg 
tttcgcatga 
ctattcggct 
ctgtcagcgc 
gaactgcagg 
gctgtgctcg 
gggcaggatc 
gcaatgcggc 
catcgcatcg 
gacgaagagc 
cccgacggcg 
gaaaatggcc 
caggacatag 
cgcttcctcg 
cttcttgacg 
ccaacctgcc 
gaatcgtttt 
tcttcgccca 
tcacaaattt 
tcatcaatgt 
catggtcata 
gagccggaag 
ttgcgttgcg 
gaatcggcca 
tcactgactc 
cggtaatacg 
gccagcaaaa 
gcccccctga 
gactataaag 
ccctgccgct 
aatgctcacg 



tcccgcccct 
cccatggctg 
tattccagaa 
gagcttgtat 
ttgaacaaga 
atgactgggc 

aggggcgccc 

acgaggcagc 
acgttgtcac 
tcctgtcatc 
ggctgcatac 
agcgagcacg 
atcaggggct 
aggatctcgt 
gcttttctgg 
cgttggctac 
tgctttacgg 
agttcttctg 
atcacgagat 
ccgggacgcc 
ccccaacttg 
cacaaataaa 
atcttatcat 
gctgtttcct 
cataaagtgt 
ctcactgccc 
acgcgcgggg 
gctgcgctcg 
gttatccaca 
ggccaggaac 
cgagcatcac 
ataccaggcg 
taccggatac 
ctgtaggtat 



2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 
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ctcagttcgg 
cccgaccgct 
ttatcgccac 
gctacagagt 
atctgcgctc 
aaacaaacca 
aaaaaaggat 
gaaaactcac 
cttttaaatt 
gacagttacc 
tccatagttg 
ggccccagtg 
ataaaccagc 
atccagtcta 
cgcaacgttg 
tcattcagct 
aaagcggtta 
tcactcatgg 
ttttctgtga 
agttgctctt 
gtgctcatca 
agatccagtt 
accagcgttt 
gcgacacgga 
cagggttatt 
ggggttccgc 
ccgatcccct 
atctgctccc 
caacaaggca 
cgctgcttcg 
aatagtaatc 
aacttacggt 
taatgacgta 
actatttacg 



tgtaggtcgt 
gcgccttatc 
tggcagcagc 
tcttgaagtg 
tgctgaagcc 
ccgctggtag 
ctcaagaaga 
gttaagggat 
aaaaatgaag 
aatgcttaat 
cctgactccc 
ctgcaatgat 
cagccggaag 
ttaattgttg 
ttgccattgc 
ccggttccca 
gctccttcgg 
ttatggcagc 
ctggtgagta 
gcccggcgtc 
ttggaaaacg 
cgatgtaacc 
ctgggtgagc 
aatgttgaat 
gtctcatgag 
gcacatttcc 
atggtcgact 
tgcttgtgtg 
aggcttgacc 
cgatgtacgg 
aattacgggg 
aaatggcccg 
tgttcccata 
gtaaactgcc 



tcgctccaag 
cggtaactat 
cactggtaac 
gtggcctaac 
agttaccttc 
cggtggtttt 
tcctttgatc 
tttggtcatg 
ttttaaatca 
cagtgaggca 
cgtcgtgtag 
accgcgagac 
ggccgagcgc 
ccgggaagct 
tacaggcatc 
acgatcaagg 
tcctccgatc 
actgcataat 
ctcaaccaag 
aatacgggat 
ttcttcgggg 
cactcgtgca 
aaaaacagga 
actcatactc 
cggatacata 
ccgaaaagtg 
ctcagtacaa 
ttggaggtcg 
gacaattgca 
gccagatata 
tcattagttc 
cctggctgac 
gtaacgccaa 
cacttggcag 



ctgggctgtg tgcacgaacc 
cgtcttgagt ccaacccggt 
aggattagca gagcgaggta 
tacggctaca ctagaaggac 
ggaaaaagag ttggtagctc 
tttgtttgca agcagcagat 
ttttctacgg ggtctgacgc 
agattatcaa aaaggatctt 
atctaaagta tatatgagta 
cctatctcag cgatctgtct 
ataactacga tacgggaggg 
ccacgctcac cggctccaga 
agaagtggtc ctgcaacttt 
agagtaagta gttcgccagt 
gtggtgtcac gctcgtcgtt 
cgagttacat gatcccccat 
gttgtcagaa gtaagttggc 
tctcttactg tcatgccatc 
tcattctgag aatagtgtat 
aataccgcgc cacatagcag 
cgaaaactct caaggatctt 
cccaactgat cttcagcatc 
aggcaaaatg ccgcaaaaaa 
ttcctttttc aatattattg 
tttgaatgta tttagaaaaa 
ccacctgacg tcgacggatc 
tctgctctga tgccgcatag 
ctgagtagtg cgcgagcaaa 
tgaagaatct gcttagggtt 
cgcgttgaca ttgattattg 
atagcccata tatggagttc 
cgcccaacga cccccgccca 
tagggacttt ccattgacgt 
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ccccgttcag 
aagacacgac 
tgtaggcggt 
agtatttggt 
ttgatccggc 
tacgcgcaga 
tcagtggaac 
cacctagatc 
aacttggtct 
atttcgttca 
cttaccatct 
tttatcagca 
atccgcctcc 
taatagtttg 
tggtatggct 
gttgtgcaaa 
cgcagtgtta 
cgtaagatgc 
gcggcgaccg 
aactttaaaa 
accgctgttg 
ttttactttc 
gggaataagg 
aagcatttat 
taaacaaata 
gggagatctc 
ttaagccagt 
atttaagcta 
aggcgttttg 
actagttatt 
cgcgttacat 
ttgacgtcaa 
caatgggtgg 
ccaagtacgc 



4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 
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cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6900 

tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6960 

tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 7020 

gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 7080 

caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 7140 

aggtctatat aagcagagct ctctggctaa ctagagaacc cactgcttac tggcttatcg 7200 

aaattaatac gactcactat agggagaccc aagcttggta cc 724? 
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